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(57) Abstract 

■ Peptides having immunological properties in common with those of the peptidic skeleton of peptides of viruses of 
the family HIV-2, particularly the envelope glycoprotein of HIV-2, characterized in that they have also a peptidic structure 
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(57) Abrege 

Peptides ayant des proprietes immunoiogiques en commun avec celles de l'ossature peptidique des peptides des vi- 
rus de la classe HIV-2, notamment de la glycoproteine d'enveloppe de HIV-2, caracterises en ce qu'ils ont egalement une 
structure peptidique en commun avec l'ossature peptidique des peptides de SIV, notamment de la glycoproteine d'enve- 
loppe de SIV. L'invention concerne des compositions de diagnostic capable de detecter une infection due a HIV-2 et des 
compositions de vaccin. 
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Peptides ayant des proprietes inimunologiques de HIV-2 

La presente invention est relative a des pep- 
tides ayant des proprietes immunologiques , le cas 
echeant immunogenes, en commun avec des antigenes sus- 
ceptibles d'etre obtenus sous une forme purifiee, a 
partir de virus capables de provoquer des lymphadeno- 
pathies susceptibles d'etre relayees ensuite par le 
symdrdme d ' iromunodef icience acquise (SIDA) chez I'homme. 

L ' invention concerne en particulier des pep- 
tides antigeniques susceptibles d'etre reconnus par des 
anticorps induits chez I'homme par des virus designes 
par 1 ' abreviation HIV, selon la nomenclature definie 
dans NATURE. Elle concerne egalement des peptides ayant 
des proprietes immunogenes ou susceptibles d'etre rendus 
immunogenes in vivo , cette immunogenicite etant suscep- 
tible de se manif ester par 1 ' induction in zis£2 d' anti- 
corps reconnaissant des antigenes caracteristiques. des 
virus HIV-2 et meme, au moins en ce qui concerne 
certains de ces peptides, des antigenes issus de HIV-1. 

L' invention concerne en outre des applications 
de ces peptides a la fabrication de compositions pour le 
diagnostic in vitro chez I'homme de potentialite de cer- 
taines formes du SIDA et, en ce qui concerne certains 
d'entre eux, a la production de compositions immunogenes 
et de compositions vaccinantes contre les retrovirus 
HIV. 

De meme 1 ' invention concerne les applications 
aux memes fins des anticorps susceptibles d'etre induits 
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in vivo par les pep-tides immunogenes ou rendus immuno- 
genes et, pour certains de ces anticorps, leurs applica- 
tions a la production de principes actif s de medicaments 
contre ces SIDAS humains . 

L 1 invention concerne egalement la mise en 
oeuvre de certains de ces peptides dans des precedes 
pour le diagnostic in vitro chez 1 1 homme de certaines 
formes " du SIDA, ainsi que leur application a la consti- 
tution de trousses ou "kits" de diagnostic. 

Un premier retrovirus denomme LAV-1 ou HIV-1 a 
ete isole et decrit dans la demande de brevet 
GB. 83/24. 800 et une demande EP, 84/401 . 834 du 14/09/84. 
Ce virus a egalement ete decrit par F.Barre Sinoussi et 
al. dans Science, 220 n* 45-99, 20 pages 868-871. 

Des" variants de ce virus HIV-1 designes par 
LAV ELI et LAV MAL, ont egalement ete isoles, caracte- 
rises et deer its dans la demande de brevet EP . 84/- 
401 .834. 

Les virus HIV-1 et leurs variants possedent 
les proprietes suivantes : 

- lis ont pour cibles pref erencielles les 
cellules Leu3 (ou lymphocytes T4) humaines et leurs 
cellules derivees "immortalisees" m 

- ils ont une activite transcriptase inverse 

2+ 

necessitant la presence d' ions Mg et presentent une 



forte activite pour le poly Cadenylate-oligo-deoxythymi- 
dy las e ) po ly ( A ) -o ligo ( dT) 1 2-18) 

ils ont une densite de 1,16 a 1,17 sur 
gradient de sucrose, 

- ils ont un diametre moyen de 139 nanometres 
et un noyau de diametre moyen de 41 nanometres, 

- les lysats de ces virus contiennent une 
proteine p25 (proteine du noyau) qui ne croise pas im- 
munologiquement avec la proteine p24 de HTLV- 1 , 

2g *- ils contiennent une proteine p42 appartenant 

a leur enveloppe, 
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ils contiennent egalement une glycoprotein 
d'enveloppe gp110 d'un poids moleculaire de 110.000. 

L'isolement et la caracterisation de retro- 
virus appartenant a une classe distincte et n'ayant 
qu'une parente immunologique reduite avec les prece- 
dents, ont ete decrits dans la demande de brevet euro- 
peen n* 87/400.151.4. Ces retrovirus qui ont ete regrou- 
pes sous la designation HIV-2, ont ete isoles chez plu- 
sieurs malades africains presentant des symptomes d'une 
lymphadenopathie ou d'un SIDA. 

Les retrovirus du type HIV-2 comme les retro- 
virus du type HIV-1, se caracterisent par un tropisme 
pour les lymphocytes T4 humains et par un effet cyto- 
pathogene a 1 ' egard de ces lymphocytes, lorsqu'ils s'y 
multiplient, pour alors causer soit des poly-adenopa- 
thies generalisees et persistantes, soit un SIDA. 

Plus generalement les retrovirus purifies par 
HIV-2 possedent en general les proprietes suivantes : 

- la cible pref erentielle des retrovirus HIV-2 est cons- 
titute par les cellules Leu3 (ou lymphocytes T4) humai- 

20 

nes et pour des cellules " immortalisees ■ derivees de ces 
lymphocytes T4 ; 

- ils sont cytotoxiques pour les lymphocytes T4 humains 

- ils ont une activite de transcriptase inverse neces- 
sitant la presence d'ions Mg 2+ et presentant une forte 
activite pour le poly (adeny late-oligodeoxy thy lmidylase) 
(poly(A)-oligo(dT) 12-18) ; 

- ils ont une densite de 1,16 dans un gradient de 
sucrose ; 

ils ont un diametre moyen de 140 nanometres et un 
noyau ayant un diametre moyen de 41 nanometres ; 

- ils peuvent etre cultives dans des lignees permanentes 
du type HUT ou exprimant la proteine T4 ; 

- ils ne sont pas infectieux pour les lymphocytes T8 ; 
les lysats de ces virus contiennent une proteine p26 

35 
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qui ne cxoise pas immunologiquement avec la proteine p24 
du virus HTLV-I ou du virus HTLV-II ; 

- ces lysats contiennent en outre une proteine p16 qui 
n* est pas reconnue immunologiquement par la proteine pi 9 
de HTLV-I ou de HTLV-II dans des essais de radioimmuno- 
precipitation ; 

- ils contiennent en outre une glycoproteine d 1 enveloppe 
ay ant un poids moleculaire de l'ordre de 130.000-140.000 
qui ne croise pas immunologiquement avec la gp1 10 des 
HIV- 1 , mais qui en revanche croise immunologiquement 
avec la glycoproteine d' enveloppe gp140 de STLV-III (vi- 
rus isole chez le singe) ; 

- ces lysats contiennent encore des antigenes marquables 

35 

par la S-cysteine r dont les poids moleculaires s 1 eta- 
15 gent entre 32'. 000 et 42.000-45.000 ; ils comprennent no- 
tamment un antigene ayant un poids moleculaire de 1 1 or- 
dre de 36.000 et un antigene ayant un poids moleculaire 
de 1 1 ordre de 42.000, 1 1 un de ces antigenes Cp36 et p42) 
constituant vraisemblablement une glycoproteine trans - 
membranaire du virus HIV-2 ; 

1VARN genomique des HIV-2 n 1 hybride pas avec 1 ' ARN 
genomique de RIV-1 dans des conditions stringentes ; 

- dans des conditions non stringentes, I'ARN genomique 
de HIV-2 n 1 hybride, hi avec le gene env et le LTR qui le 
jouxte, de HIV-1 , ni avec des sequences de la region pol 
du genome de HIV-1 ; 

- dans des conditions non stringentes, il hybride fai- 
blement avec des sequences de nucleotides de la region 
de HIV-1. 

30 Un autre retrovirus denomme SIV-1 , cette 

denomination remplagant la denomination anterieurement 
connue STLV III, a ete isole chez le singe macaque 
rhesus. (M.D. Daniel et al. Science 228, 1201 (1985) 
N.L.Letwin et al, Science 230, 71 (1985) sous l'appel- 

35 lation "STLV-IIImac" ) . 
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Un autre retrovirus, designe " STLV-ITI AGM " , 
(ou SIV. rM ) a ete isole chez des singes verts sauvages . 
Mais, contrairement au virus present chez le singe 
macaque rhesus, la presence de " STLV-III^^' ne semble 
pas induire une maladie du type SIDA chez le singe vert 
d 1 Af rique . 

Une souche du retrovirus SIV- 1 mac a ete 
deposee a la CNCM le 7 Fevrier 1986 sous le n # 1-521. 
Des etudes ont montre que le retrovirus SIV-1 comporte 
certaines proteines possedant une certaine parente 
immunologique avec des proteines ou glycoproteines 
structurales susceptibles d'etre obtenues dans des con- 
ditions analogues, a partir de HIV-2. Ce retrovirus 
SIV-1, dont on a constate le caractere infectieux chez 
les singes, avait ete designe par STLVIII par les cher- 
cheurs qui 1 1 ont isole (references bibliographiques 
precitees ) . 

Pour la commodite du langage, ces virus ne 
seront plus designes dans ce qui suit que par i 1 ex- 
pression SIV (1' expression SIV est 1 1 abreviation 
anglaise de "Simian Immunodeficiency Virus" (virus 
d' immunodef icience du singe)) eventuellement suivi d'une 
abreviation designant l'espece de singe dont ils sont 
issus, par exemple, MAC (ou mac) pour le macaque ou AGM 
pour le singe vert d'Afrique (abreviation de "African 
Green Monkey" ) . 

En mettant en oeuvre les memes techniques que 
celles rappelees plus haut, il a ete constate que 1 1 on 
pouvait egalement obtenir a partir de SIV-1mac : 

- une proteine principale du noyau p27, ayant un poids 
moleculaire de l f ordre de 27 kilodaltons, 

- une glycoprotein© majeure d'enveloppe, gp140, 

une proteine vraisemblablement transmembranaire p3 2, 
qui n'est guere observee en RIPA lorsque le virus a au 
prealable ete marque par la 35 S-cysteine, mais qui peut 
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etre observee dans les essais d 1 immunoempreintes 
(Western blots ) , sous forme de bandes larges . 

Des etudes plus precises ont ete realisees en 
ce qui concerne les precedents virus HIV-2 et SIV. La 
poursuite de l 1 etude des retrovirus HIV-2 a egalement 
conduit a 1 ' obtention de sequences d * ADN complementaires 
(ADNc) des AKNs de leurs genomes. La sequence nucleoti- 
dique complete de l r ADNc d'un retrovirus representatif 
de la classe HIV-2 (HIV-2 ROD) a ete deposee le 21/02/- 
1986 a la CNCM sous le n* 1-522, sous le nom de refe- 
rence LAV- I I ROD) . 

Cette sequence nucleotidique et les phases de 
lecture ouverte qu 1 elle contient sont indiques a la fi- 
gure 1 A . 

En outre, la poursuite de 1 ' etude d'autres re- 
trovirus a egalement permis d'aboutir a 1* obtention de 
leurs sequences nucleotidiques completes . II en est en 
particulier ainsi de 1 1 ADNc derive de 1 1 ARN genomique de 
SIV. 

Le clonage et. le sequ engage du virus SIV- 1 mac 
qui ont permis 1 1 obtention de sa sequence nucleotidique 
ont ete realises dans les conditions suivantes : 

L'ADN de cellules HUT 78 infect ees par le vi- 
rus SIV (isolat STLV-III mac 142-83 decrit par Daniel et 
al. (1985) Science, 228 . p. 1201-1204, digere partielle- 
ment par 1 1 enzyme de restriction Sau3A a ete clone au 
site BamHI du bacteriophage vecteur Lambda ELBL3 pour 
constituer une banque genomique. Les 2 millions de pha- 
ges recombinants de la banque genomique ainsi constitute 
ont ete cribles in situ en conditions de securite P3 f a 
1/ aide de sequences du virus HTV2 provenant des clones 
lambda-R0D4, lambda-R0D35 et E2 (Clavel et al. (1986- 
Nature, 324 / p. 691.) et nick-translatees . 

L ' hybridation a ete realisee en 5xSSC a 50* C 
35 et les lavages en 2xSSC a 50* C. Un seul clone contenant 
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1' ensemble des sequences virales a ete obtenu. Ce clone 
est designe par lambda-SIV- 1 . L'inserat du phage lambda- 
SIV-1 mesure 16,5 kb au total et comprend un provirus 
integre auquel manquent seulement les 250 premieres ba- 
ses du LTR gauche, alors que le LTR droit est complet. 

Le provirus integre a ete sequence par la me- 
thode des dideoxynucleotides apres sous-clonage de frag- 
ments aleatoires dans le phage M13mp8. 300 sous-clones 
ont ete analyses. 

Des fragments d 1 ADNc provenant du clone Lambda 
SIV-1 inseres dans des plasmides pSIV-1.1 et pSIV-1.2 
ont ete deposes a la CNCM le 15 Avril 1987, sous les 
numeros 1-658 (pSIV-1.1) et 1-659 (pSIV-1.2). 

Les resultats ont ete mentionnes dans les fi- 
gures decrites ci-apres. 

La figure 1B represente la sequence nucleo- 
tidique du, genome viral de SIV et les sequences qui en 
sont deduites pour les proteines virales correspondant 
aux produits des genes gag, pol, env, Q, X, R f tat, art, 
F. 

Les figures 3 a 11 et la figure 1C repre- 
sentent les comparaisons des produits theoriques des 
genes viraux et des LTR entfe HIV2 et SIVmac. (XSIV-1 ) . 

L 1 invention concerne de plus les fragments 
d'ADNc deduits de 1 1 ADNc issu du genome entier de SIV-1, 
ces fragments contenant une ou plusieurs sequences is- 
sues de la sequence complete d'ADNc et qui codent pour 
des peptides interessants de 1' invention. Ces sequences 
sont indiquees a la figure 1B et, a la figure 1C pour ce 
qui a trait a la sequence LTR du virus, 

Les sequences nucleiques de l'ADNc de SIV ont 
ete placees en correspondance avec les sequences nu- 
cleiques du virus HIV- 2 ROD pour ce qui concerne la se- 
quence LTR (figure 1C) . Cette presentation que 1 1 on re- 
trouve pour le genome entier en rapprochant la figure 1B 
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des figures 3 a 11 permet de reperer ou de deduire les 
acides nucleiques ayant des elements de structure essen- 
tials communs aux deux virus . 

L ' invention concerne natur el lenient aussi l r u- 
tilisation des cADNs issus de SIV ou de leurs fragments 
(ou de recombinants les contenant) en tant que sondes f 
pour le diagnostic de la presence ou non de virus HIV- 2 
dans des echantillons de serums ou d'autres liquides ou 
tissus biologiques obtenus a partir de patients 
suspectes d'etre porteurs du virus HIV-2 . Ces sondes 
sont de preference marquees egalement (marqueurs 
radio -actif s, enzymatiques , f luorescents f etc.). Des 
sondes particulierement interessantes pour la mise en 
oeuvre du procede de diagnostic du virus HIV-2 ou d'un 
variant de HIV-2 peuvent et're caracterisees en ce 
qu 'elles comprennent la totalite ou une fraction de 
1 1 ADNc complement aire du genome du virus SIV ou encore 
notamment les fragments recombinants contenus dans 
divers clones. 

Les sondes mises en oeuvre dans ce procede de 
diagnostic du virus HIV-2 et dans les kits de diagnostic 
ne sont en aucune f agon reduites aux sondes decrites 
precedemment . Elles comprennent au contraire toutes les 
sequences nucleotidiques issues du genome du virus SIV , 
d'un variant de SIV ou d r un virus proche par sa structu- 
re, des lors qu 1 elles permettent la detection dans des 
fluides biologiques de personnes susceptibles de 
developper un SIDA r d'anticorps diriges centre un HIV-2 
ou d'un virus qui en est proche. 

La detection peut etre realisee de toutes 
fagons en soi connues. Elle peut comprendre une mise en 
contact de ces sondes soit avec les acides nucleiques 
obtenus a partir des cellules contenues dans ces serums 
ou autres milieux biologiques, par exemple liquides 
cephalo-rachidiens r salives, etc... Elle peut aussi 
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comprendre une mise en contact de ces sondes avec ces 
milieux eux-memes des lors que leurs acides nucleiques 
ont ete rendus accessibles a 1 ' hybridation avec ces 
sondes, et ce dans des conditions permettant 1' hybri- 
dation entre ces sondes et ces acides nucleiques. L'e- 
tape finale du diagnostic in vitro comprend alors la 
detection de 1 ' hybridation eventuellement produite. Le 
susdit diagnostic mettant en jeu des reactions d' hy- 
bridation peut egalement etre realise a 1 * aide de me- 
langes de sondes respectivement originaires d'un HIV-2 
et d'un SIV-1 ou d'un HIV-1, d'un HIV-2 et d'un SIV, des 
lors qu f il n ! est pas necessaire de faire une difference 
entre le type de virus recherche. 

D'une fa^on generale, le procede de diagnostic 
de la presence ou non du virus HIV-2 ou d'un variant 
dans des echantillons de serums ou d' autres liquides ou 
tissus obtenus a partir de patients suspectes d'etre 
porteurs du virus HIV-2 comprend les etapes suivantes : 

1/ au moins une etape d ' hybridation conduite 
dans des conditions stringentes, par mise en contact de 
l'ADN de cellules de 1 1 echantillon du patient suspect 
avec I'une des susdites sondes marquees sur une membrane 
appropriee, 

2/ le lavage- de ladite membrane avec une so- 
lution assurant la conservation de ces conditions strin- 
gentes de. 1 ' hybridation, 

3/ la detection de la presence ou non du virus 
HIV-2 par une methode d 1 immunodetection. 

Dans un autre mode de realisation prefere du 
procede selon 1 1 invention 1 1 hybridation precitee est 
conduite dans des conditions non stringentes et le la- 
vage de la membrane est realise dans des conditions 
adaptees a celles de 1 * hybridation . 

II va de soi que 1 1 invention concerne les 
acides nucleiques correspondant a des sequences placees 
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en des regions analogues de variants de SIV ainsi que 
tous les acides nucleiques dont les modifications re- 
sulteraient de la mise a profit de la degeneres cence du 
code gerietique. 

Les etudes comparatives qui ont aussi permis 
d 1 aboutir a des resultats reiatif s aux proteines de 
noyau (core) , ci-apres denommees "proteines aaa " et aux 
proteines d 1 enveloppes , ci-apres denommees " proteines 
env" , ont egalement ete rapport es dans la demande de 
brevet europeen n* 87/400. 151 . 4, deja citee. Ces re- 
sultats montrent que les proteines du noyau (proteines 
<xacr ) dans HIV-2 presentent des differences moins ac- 
centuees par rapport a celles des virus HIV- 1 , que les 
proteines d ' enveloppe (proteines env) . Globalement les 
proteines env dans HIV-2 se sont revelees presenter des 
parentes immunologiques extremement faibles, sinon 
inexistentes , avec les proteines env correspondantes des 
virus HIV- 1 . 

Au contraire des etudes comparatives ef f ec- 
tuees entre les structures des sequences d'ADNc des vi- 
rus HIV-2 et SIV permettent de mettre en evidence cer- 
taines caracteristiques communes qui apparaissent au 
niveau des proteines, 

Globalement, les proteines de HIV-2 et de 
25 SIV-1 montrent des parentes immunologiques importantes. 

La glycoproteine majeure d' enveloppe de HIV-2 
s 1 est revelee etre plus proche immunologiquement de la 
glycoproteine majeure d 1 enveloppe de SIV que de la gly- 
coproteine majeure d f enveloppe de HIV-1 . 
30 Ces constatations s'imposent non seulement au 

niveau des poids moleculaires : 130-140 kilodaltons pour 
les glycoproteines majeures de HIV-2 et de SIV contre 
environ 110 pour la glycoproteine majeure d 1 enveloppe de 
HIV- 1 f mais aussi au niveau des proprietes immunolpgi- 
35 ques, puisque des serums preleves a partir de malades 
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infectes par HIV-2, et plus particulierement des anti- 
corps formes contre la gp140 de HIV-2 reconnaissent la 
gp140 de SIV-1mac, alors que dans des essais semblables 
les memes serums et les memes anticorps de HIV-2 ne 
reconnaissent pas la gp110 de HIV-1. Mais les serums 

anti-HIV-1 qui n 1 ont jamais reagi avec la gp140 de HIV-2 

35 

precipitent une proteine de 26 Kdal marquee par la S- 
cysteine, contenue dans les extraits de HIV-2. 

La proteine majeure du noyau (core) de HIV-2 
semble presenter un poids moleculaire moyen (environ 
26.000) intermediaire entre celui de la p25 de HIV-1 et 
la p27 de SIV. 

Ces observations resultent des essais realises 
avec des extraits viraux obtenus a partir du HIV-2 isole 
a partir de I'un des patients susmentionnes . Des re- 
sultats similaires ont ete obtenus avec des extraits vi- 
raux du HIV-2 isole a partir du second patient. 

Des etudes plus poussees ont conduit les in- 
venteurs a reconnaitre une premiere classe de peptides 
ayant des sequences d ' aminoacides soit identiques, soit 
proches de sequences contenues a 1 1 interieur des stru- 
ctures des proteines gag et env de HIV-2 ou de SIV voire 
de HIV-1 . Ces peptides sont notamment applicables au 
diagnostic d \ une infection chez l'homme par le virus 
HIV-2 ou de l'un de ses variants. 

A cet egard la presente invention concerne 
egalement des procedes et des compositions de diagnostic 
pour la detection in vitro d* anticorps diriges contre un 
virus HIV-2 ou de ses variants, plus particulierement 
dans des echantillons biologiques, notamment des serums 
de patients ayant subi une infection par le virus HIV-2, 
certains de ces peptides permettant une discrimination 
particulierement poussee entre les infections dues a des 
virus HIV-2 et a des virus HIV-1 . 

Ces etudes poussees ont egalement conduit a la 
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possibility de synthetiser des peptides immunogenes ou 
susceptibles d'etre rendus immunogenes, presentant des 
caracteris.tiques de structures leur permettant d 1 induire 
in vivo la production d ' anticorps susceptibles de re- 
connaitre des proteines env a la fois dans HXV-1 et dans 
HIV-2 et, au moins pour certains de ces peptides, de se 
fixer tant sur des virus HIV-1 que sur des virus HIV-2, 
plus particulierement aux fins de les neutraliser . 
L 1 utilisation de ces dernier s types de peptides est done 
particulierement indiquee pour la production de princi- 
pes actifs de vaccins contre les virus HIV, done contre 
le SID A'. 

Pour designer ci-apres les residus d* amino- 
acides entrant dans la constitution des peptides selon 
1 1 invention, * on aura recours , pour ceux des acides ami- 
nes ayant une signification univoque a la nomenclature- 
international e designant chaque acide amine naturel par 
une lettre unique (lettre majuscule) selon le tableau 
des eoxrespondances qui suit : 



35 





Methionine 


L 


Leucine 


I 


Isoleucine 


V 


Valine 


F 


Phenylalanine 


S 


Serine 


P 


Proline 


T 


Threonine 


A 


Alanine 


Y 


Tyrosine 


H 


Histidine 


Q 


Glutamine 


N 


Asparagine 


K 


Lysine 


D 


Acide Aspartique 


E 


Acide glutaminique 
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C Cysteine 
W Tryptophane 
R Arginine 
G Glycine 

Lorsqu'un acide amine pourra, en raison de sa 
position au sein de la chaine d ' aminoacides caracte- 
ristique d ' un peptide determine, prendre plusieurs si- 
gnifications, il pourra soit etre designe par un tiret 
M , si sa signification peut etre quelconque, soit par 
une lettre minuscule lorsque cet aminoacide pourra 
presenter un nombre limite de significations preferees, 
ce nombre etant cependant tou jours super ieur a 1 . Dans 
ce dernier cas, les significations possibles de cette 
lettre minuscule seront toujours precisees en rapport 
avec le peptide auquel il appartient. 

Afin de faciliter la lecture, ces peptides 
seront designes par une abreviation env ou gag suivie 
d'un indice numerique, par reference a des sequences 
d' aminoacides contenues , selon le cas, soit dans les 
proteines env soit dans les proteines aaa de certains 
HIV-1, HIV-2 ou SIV. II y sera encore fait reference 
dans ce qui suit. 

Enfin dans les definitions qui suivent 
- les groupes X representent soit un groupe NH 2 libre ou 
amide, notamment par un ou deux groupes alcoyle com- 
prenant de 1 a 5 atones de carbone, soit un groupe pep- 
tidique comprenant de 1 a 5 aminoacides, dont 1 1 amino- 
acide N-terminal presente lui-meme un groupe NH 2 libre 
ou amide comme precedemment indique, et 

les groupes Z representent, soit un groupe -OH libre 
ou alcoxyle et contenant alors un groupe alcoyle com- 
prenant de 1 a 5 atomes de carbone, soit un groupe pep- 
tidique comprenant de 1 a 5 aminoacides, dont 1' ami- 
noacide C- terminal presente lui-meme un groupe -OH 
libre . ou alcoxyle, comme precedemment indique, les 
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groupes de 1 a 5 acides amines le cas echeant contenus 
dans X ou Z ou dans les deux a la fois etant tels, que 
leur presence n'est pas incompatible avec la preserva- 
tion pour 1 ' essentiel des proprietes immunologiques , le 
cas echeant immunogenes , des peptides qui en sont de- 
pour vus ,- 

Les peptides selon 1' invention, qui orit en 
commun des proprietes immunologiques avec des antigenes 
de .HIV- 2 et , pour certains d'entre eux egalement avec 
des antigenes de HIV-1 ou de ses variants, sont caracte- 
rises en ce qu' ils ant "egaement une structure peptidique 
en commun avec les antigenes de SIV. De facon avanta- 
geuse, ces peptides comprennent normalement au plus 40 
residus d ' acides amines. 

Des "peptides prefer es sont les suivants : 

envl 

XRV- A I EKYL-DQA- LN-WG C&FRQ VC Z 
env2 

X-LE-AQI-QQEKNMYELQKLNZ 
env3 

XELGD YKL VE I TP I G - APT — KR Z 

env4 

X- VT V- YGVP - WK — AT ■ — LF C A - Z 

envS 

X QE — L-NVTE-F — W-NZ , 

env6 

XL S-KPCVKLTPLCV- - Z 

env7 

X — -N-S-IT — C-K — — Z 
env8 

X-I— YC-P-G-A-L-C-N-TZ 
env9 

X— A-C — W — Z 

env10 

X-G-DPE— NC-GEF-YCN NZ 
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envl 1 

x C-IKQ-I G YZ 

Plus particulierement 1 ' invention concerne les 
peptides suivants : 

5 env1 

XRV-AIEKYL-DQA-LN-WGCAFRQVCZ 

env2 

X-LE-AQIQQEKNMYELQKLNZ 
env3 

1Q XELGDYKLVEITPIG-APT--KR Z 

env4 

x VTV-YGVP-W--AT— LFCA-Z 

env5 

x £ — L-NVTE-F — W-NZ 

15 . 

XL S-KPCVKL-PLC Z 

env7 

x N-S-I C-K Z 

env8 

20 X-I YC-P-G-A-L-C-N-TZ 

env9 

X A-C W — Z 

envIO 

X-G-DPE NC-GEF-YC NZ 

25 envli 

X C-I-Q-I G YZ 

Des peptides avantageux correspondant aux pre- 
cedents, presentent les formules qui suivent : 
envj. 

30 XRVTAIEKYLQDQARLNSWGCAFRQVCZ , OU 
XRVTA I EK YLKDQ AQLNAWGC AFRQVC Z 
env2 

XSLEQAQIQQEKNMYELQKLNSWZ , OU 
XLLEEAQ IQQEKNMYELQKLNSWZ 



35 



WO 88/05440 



PCT/FR88/00025 



10 



15 



20 



25 



30 



35 



16 

env3 

XEL GD YKL VE I TP I GF AP T KEKR Y S S AH Z , ou 
XELGDYKLVEITPIGLAPTNVKRYTTG-Z 

(On remarquera que les peptides envl , env2 , env3 
attestent de la tres grande parents entre HIV-2 et 
SIV-1. En effet le premier peptide est inclu dans le 
genome de HIV-2 et le second, dans celui de SIV-1 ) . 
env4 

XabcdVTVeYGVPfWogAThiLFCAj Z r 

dans -les quels les lettres de a a j peuvent avoir les 

significations suivantes : 

a est Cf E ou D 

b est' T f K r D r N ou I 

c est Q ou L 

d est Y ou W " 

e est F ou Y 

f est T f V ou A 

g es.t N ou E 

h est I ou T 

i est P ou T 

j est T ou S 

0 est K ou R 
env5 

XabcoEdeLf NVTEgFhiWjNZ , 

dans lequel les lettres de a a j peuvent avoir les 

significations suivantes z 

a est D ou P 

b est D ou N 

c est Y ou P 

d est X, V, I ou L 

e est T, V r E ou A 

f est V, G ou E ou - 

g est A, N f G ou S 

h est D ou H 

1 est A ou M 
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j est N, K ou E 
o est Q ou S 
env6 

XLabcSdKPCVKLoPLCuefKZ , 

dans lequel les lettres de a a f peuvent avoir les 

significations suivantes : 

a est F ou W 

b est E ou D 

c est T ou Q 

d est I ou L 

e est A, S ou T , 

f est M ou L 

0 est T ou S 
u est V ou I 
env7 

XabCNxSylocdCeKf ghiZ , 

dans lequel les lettres de a a i et x et y peuvent avoir 

les significations suivantes : 

a est N ou T ou I 

b est H ou S ou N 

c est E ou Q 

d est S, A ou C 

e est D ou P — 
f est H| V ou D 
g est Y ou S 
h est W ou F 

1 est D ou E 
x est T ou R 
y est V ou A 
o est T ou Q 
env8 

XalbcdYCxPeGf AgLhCiNjTZ , 

dans lequel les lettres de a a k et x peuvent avoir les 
significations suivantes : 
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a 


est 


A 


ou 


p 


b 


est 


R 


ou 


p 


c 


est 


F, 


I 


ou C 


d 


est 


R 


ou 


H 


e 


est 


P 


ou 


A 


I 


4- 

est 


v 

X 


ou 


tt 


g 


est 


L 


ou 


i 


h 


est 


R 


ou 


K 


i 


est 




ou 


N 


j 


est 


D 


ou 


K 




est 


A 


ou 


T 



env9 

XwabcxyAdCef ghizW jkZ r 

dans lequel les lettres de a a k et x a z peuvent avoir 
les significations suivantes : 
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a 


est 


K 


ou 




ou 


E 






b 


est 


R 


ou 












c 


est 


P 


ou 


M 


ou 


I 






d 


est 


W 


ou 


H 


ou 


Y 






e 


est 


W 


ou 


N 


ou 


T 


ou 


R 


f 


est 


F 


ou 


I 










g 


est 


K 


ou 


s 


ou 


N 


ou 


G 


h. 


est 


G 


ou 


R 


ou 


E 






i 


est 




ou 


A 


ou 


T 








est 


K 


ou 


N 


ou 


D 


ou 


S 


k 


est 


D 


ou 


A 


ou 


N 


ou 


K 


w 


est 


N, 


D 


ou I 








X 


est 


R 


ou 


G 


ou 


K 






y 


est 


Q 


ou 


K 


ou 


R 






z 


est 


K 


ou 


E 


ou 


Q 


ou 


N 


env10 

















XaGbDPEcdef ghNCiGEF j YCokxlmnNZ , 

dans lequel les lettres de a a n et x peuvent avoir les 
significations suivantes : 
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a 


est 


K 


ou 




ou 


G 


b 


est 


s 


ou 


G 


ou 


- 


c 


est 


V 


ou 


I 






d 


est 


A 


ou 


V 


ou 


T 


e 


est 


Y 


ou 


T 


ou 


M 


f 


est 


M 


ou 


H 






g 


est 


W 


ou 


s 






h 


est 


T 


ou 


F 






i 


est 


R 


ou 


G 






3 


est 


L 


ou 


F 






o 


CO L. 


N 
n 


on 


K 






k 


est 


M 


ou 


s 






1 


est 


W 


ou 


Q 


ou 


K 


m 


est 


F 


ou 


L 






n 


est 


L 


ou 


F 






X 


est 


T 


ou 


S 


ou 


N 



envl 1 

XabcdwCeloQf IxgyhizG jklYZ , 

dans lequel les lettres de a a 1 et w a z petivent avoir 
les significations suivantes : 
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a 


est 


R 


ou 


T 


b 


est 


N 


ou 


I 


c 


est 


Y 


ou 


T 


d 


est 


A 


ou 


L 


e • 


est 


H 


ou 


R 


f 


est 


I 


ou 


F 


g 


est 


T 


ou 


M 


h 


est 


H 


ou 


Q 


i 


est 


K 


ou 


E 


j 


est 


R 


ou 


K 


k 


est 


N 


ou 


A 


1 


est 


V 


ou 


M 


w 


est 


P 


ou 


Q 


X 


est 


N 


ou 


K 


y 


est 


W 


ou 


V 
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z est V ou T ou K 
o est K ou R 

La structure du peptide antigenique code par 
le gene gag et designe par gag l est egalement represen- 
tee ci-apres : 
XDCKLVLKGLGaNPTLEEMLTAZ r 

dans lequel la lettre a designe M ou T. 

II sera remarque que, d'une fa^on general e, 
les aminoacides ayant une signification univoque (done 
representes par une lettre majuscule correspondant a la 
nomenclature international e) qui interviennent dans les 
definitions qui precedent des peptides selon 1 ' inven- 
tion, se trouvent etre la correspondance avec des amino- 
acides identiques places dans le meme ordre dans les se- 
quences env ou gag correspondantes de la proteine env ou 
aaa d 1 au moins l'un des HIV, ou de SIV-1 . 

Les positions de ces sequences sont soulignees 
et reperees au sein des sequences d ' aminoacides des 
proteines env respectivement de HIV-2 ROD (CNCM n* 
1-532) et HIV-1 BRU (CNCM n* 1-232} representees a la 
figure 2. Par ailleurs, les alignements des acides ami- 
nes des proteines env et gag respectivement de SIV-1mac 
(CNCM n* 1.521) et de HIV-2 ROD sont presentees a la 
figure 3 et a la figure 4. 

Les traits pleins qui apparaissent en certai- 
nes localisations de ces sequences visent a souligner 
que certains aminoacides contenus dans ces sequences ont 
ete volontairement deletes au plan de la presentation, 
afin de permettre la mise en alignement d 1 aminoacides 
respectivement identiques (alors marques d'un aste- 
risque) ou de deux points verticaux sur une meme ligne 
verticale dans les sequences des proteines correspon- 
dantes de HIV-1 et de HIV-2 d'une part, de SIV et de 
HIV-2 d' autre part. 
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Outre les peptides precites, 1 ' invention con- 
cerne egalement les peptides modifies par insertion 
et/ou deletion et/ou substitution d ' un ou plusieurs 
acides amines, pour autant que les proprietes antige- 
niques ou immunogenes desdits peptides ne sont pas mo- 
difiees, ou que les proprietes de reconnaissance de 
1 ' antigene ou de 1 ' anticorps avec lesdits peptides ne 
sont pas substantiellement modif iees . 

Dans un mode de realisation particulierement 
prefere, 1 ' invention concerne des peptides ayant des 
proprietes immunologiques en commun avec l'ossature 
peptidique de la glycoproteine d'enveloppe des virus de 
la classe HIV-2, ces peptides contenant un nombre de 
residus d' acides amines n ' excedant pas 40. 

Ces peptides preferes selon 1 ' invention ont 
les sequences suivantes : 
envl 

RVTAIEKYLQDQARLNSWGCAFRQVC 

AIEKYLQDQ 
RVSAIEKYLKDQAQLNAWGCAFRQVC 

AIEKYLKDQ 
env2 

SLEQAQIQQ EKNMYELQKLN S W 

QIQQEKN 
LLEEAQ I QQEKNMYELQKLNSW 
envl 

ELGDYKLVEI TP I GFAPTKEKRYSSAH 

YKLVEITPIGFAPTKEK 
ELGDYKLVEITPIGLAPTNVKRYTTG- 

YKLVEITPIGLAPTNVK 

env4 

CTQYVTVFYGVPTWKNATIPLFCAT 

VTVFYGVPTWKNAT 
CIQYVTVFYGVPAWRNATIPLFCAT 

VTVFYGVPAWRNAT 
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EKLWVTVYYGVPVWKEATTTLFCAS 

VTVYYGVPVWKEAT 
EDLWVTVYYGVPVWKEATTTLFCAS - 

VTVYYGVPVWKEAT 
DNLWVTVYYGVPVWKEATTTLFCAS 

VTVYYGVPVWKEAT 

env5 

DDYQEITL-NVTEAFDAWNN 

L-NVTEAF 
DDYSELAL-NVTESFDAWEN 

L-NVTESF 
PNPQEWLVNVTENFNMWKN 

LVNVTENF 
PNPQEIELENVTEGFNMWKN 

LENVTEGF 
PNPQEIALENVTENFNMWKN 

LENVTENF 

env6 

ETS IKPCVKLTPLCVAMK 
ETSIKPCVKLSPLCITMR 
DQSLKPCVKLTPLCVSLK 
DQSLKPCVKLTPLCVTLN 
PCVKLTPLCV 

env7 

NHCNTSVITESCD 

NTSVIT 
NHCNTSVIQECCD 

NTSVIQ 
TSCNTSVITQACP 

NTSVIT 
INCNTSVITQACP 

NTSVIT 
INCNTSAITQACP 

NTSAIT 
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enva 

YCAPPGYALLRC-NDT 
YCAPAGFAILKCNNKT. 
YCAPAGFAILKCNDKK 
YCAPAGFAILKCRDKK 
env9 

NKRPRQ AWCWFKG - KWKD 
NERPKQAWCRFGG-NWKE 
N — MRQAHCNI SRAKWNA 
D--IRRAYCTINETEWDK 
I - - IGQAHCNI SRAQWSK 
envl 0 

KGSDPEVAYMWTNCRGEFLYCNMTWFLN 

NCRGEFLYCN 
GG -DPEVTFMWTNCRGEFL YCKMNWFLN 

NCRGEFLYCK 
-GGDPEIVTHSFNCGGEFFYCNSTQLFN 

NCGGEFFYCN 
-GGDPEITTHSFNCRGEFFYCNTSKLFN 

NCRGEFFYCN 
-GGDPEITTHSFNCGGEFFYCNTSGLFN 

NCGGEFFYCN 

envl 1 

RNYAPCHIKQI INTWHKVGRNVY 

CHIKQII 
RNYVPCHIRQI INTWHKVGKNVY 

CHTRQII 
T I TLPCRIKQFINMWQEVGKAMY 

CRIKQFI 
SITLPCRIKQIINMWQKTCKAMY 

CRIKQII 
NITLQCRIKQIIKMVAGR-KAIY 

CRIKQII 

aaq1 

DCKLVLKGLGTNPTLEEMLTA 
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Les peptides selon 1 1 invention peuvent encore 
avantageusement etre prepares par Les techniques clas- 
siques, dans le domaine de la synthese des peptides. 
Cette synthese peut etre realises en solution homogene 
ou en phase solide. 

Par exemple, on aura recours a la technique de 
synthese en solution homogene decrit par HOUBENWEYL dans 
I'ouvrage intitule "Methode der Organischen Cheraie" 
(Methode de la Chimie Organique) edite par E. Wunsch, 
vol. 15-1 et II. , THIEME, Stuttgart 1974. 

Cette methode de synthese consiste a condenser 
success ivement deux-a-deux les aminoacyles successifs 
dans I'ordre requis, ou a condenser des aminoacyles et 
des fragments prealablement formes et contenant de ja 
15 plusieurs aminoacyles dans 1 ' ordre approprie, ou encore 
plusieurs fragments prealablement ainsi prepares, etant 
entendu que 1 1 on aura eu soin de proteger au pr ealable 
toutes les fonctions reactives portees par ces amino- 
acyles ou fragments, a 1' exception des fonctions amines 
de l*un et carboxyles de 1" autre ou vice- versa, qui 
do i vent normalement inter venir dans la formation des 
liaisons peptidiques , notamment apres activation de la 
fonction carboxyle, selon les methodes bien connues dans 
la synthese des peptides. En variante, on pourra avoir 
recours a des reactions de couplage mettant en jeu des 
reactifs de couplage classique, du type carbodiimide, 
tels que par exemple la 1 -ethyl-3- ( 3-dimethyl-amino- 
propyl) -carbodiimide . Lorsque l'aminoacyle mis en oeuvre 
possede une fonction acide supplementaire (notamment 
dans le cas de 1* acide glutamique), ces fonctions seront 
par exemple protegees, par des groupes t-bustylester . 

Dans le cas de la synthese progressive, acide 
amine par acide amine, la synthese debute de preference 
par la condensation de 1 1 amino-acide C-terminal avec 
35 l'aminoacide qui correspond a l'aminoacyle voisin dans 
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la sequence desiree et ainsi de suite, de proche en 
proche, jusqu'a 1' acide amine N- terminal. Selon une 
autre technique preferee de 1' invention, on a recours a 
celle decrite par R.D. MERRIFIELD dans 1 ' article 
intitule "Solid phase peptide synthesis" (J. Am. Soc, 
45, 2149-2154). 

Pour fabriquer une chaine peptidique selon le 
procede de MERRIFIELD, on a recours a une resine polyme- 
re tres poreuse, sur laquelle on fixe le premier acide 
amine C-terminal de la chaine. Get acide amine est fixe 
sur la resine par 1 1 intermediaire de son groupe 
carboxylique et sa fonction amine est protegee, par 
exemple par le groupe t-butyloxycarbonyle . 

Lorsque le premier acide amine C-terminal est 
ainsi fixe sur la resine, on enleve le groupe protecteur 
de la fonction amine en lavant la resine avec un acide. 

Dans le cas ou le groupe protecteur de la 
fonction amine est le groupe t-butyloxycarbonyle , il 
peut etre elimine par traitement de la resine a 1 ' aide 
d' acide trif luoroacetique . 

On couple ensuite le deuxieme acide amine qui 
fournit le second amino-acyle de la sequence recherche, 
a partir du residu amino-acyle C-terminal sur la fonc- 
tion amine deprotegee du premier acide amine C-terminal 
fixe sur la chaine. De peference, la fonction carboxyle 
de ce deuxiejne acide amine est activee, par exemple par 
la dicyclohexylcarbodiimide, et la fonction amine est 
protegee, par exemple par le t-butyloxycarbonyle. 

On obtient ainsi la premiere partie de la 
chaine peptidique recherchee, qui comporte deux acide 
amines, et dont la fonction amine terminale est 
protegee. Comme precedemment , on deprotege la fonction 
amine et on peut ensuite proceder a la fixation du 
troisieme aminoacyle, dans les conditions analogues a 
celles de 1* addition du deuxieme acide amine C-terminal. 

35 
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On fixe ainsi, les uns apres les autres, les 
acides amines qui vont constituer la chaine peptidique 
sur le groupe amine chaque fois deprotege au prealable 
de la portion de la chaine peptidique deja formee, et 
qui est rattachee a la resine. 

Lor s que la totalite de la chaine peptidique 
desiree est * formee, on elimine les groupes protecteurs 
des differents acide amines constituant la chaine pepti- 
dique et on detache le peptide de la resine par exemple 
a 1 1 aide d 1 acide f luorydrique . 

L 1 invention concerne egalement les oligomeres 
hydrosolubles des peptides monomeres sus-indiques . 
L* oligomerisation peut provoquer un accroissement de 
1 1 immunogenicite des peptides monomeres selon 1 1 inven- 
tion. Sans qu'une telle indication chiffree puise etre 
consider ee comme limitative r on mentionnera neanmoins 
que ces oligomeres peuvent, par exemple, contenir de 2 a 
10 unites monomeres. 

Les "unites monomeres entrant dans cet oligo- 
mere sont soit toutes constituees par le polypeptide de 
sequence 1 ou par le polypeptide de sequence 2, soit par 
1' un et 1* autre de ces polypeptides. 

On peut avoir recours/ pour realiser 1' oligo- 
merisation, a toute technique de polymerisation couram- 
ment utilisee dans le domaine des peptides, cette poly- 
merisation etant conduite jusqu' a 1 1 obtention d'un oli- 
gomere ou polymere contenant le nombre de motifs mono- 
meres requis pour 1 ' acquisition de 1 1 immunogenicite 
desiree. 

Une methode d' oligomerisation ou de polyme- 
risation du monomere consiste dans la reaction de 
celui-ci avec un agent de reticulation tel que le glu- 
taraldehyde . 

On peut egalement avoir recours a d ' autres me- 
thodes d*' oligomerisation ou de couplage, par exemple a 
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celle mettant en jeu des couplages successifs d' unites 
monomeres , par 1 ' intermediate de leurs fonctions ter- 
minales carboxyle et amine en presence d* agents de cou- 
plage homo- ou hetero- bif onctionnels . 

On peut egalement pour la production de mole- 
cules comportant un ou plusieurs motifs de 17 acides 
amines tels que definis ci-dessus, avoir recours a des 
techniques du genie genetique mettant en oeuvre des 
micro-organismes transformes par un acide nucleique 
determine comprenant des sequences nucleotidiques ap- 
propriees correspondantes . 

L 1 invention concerne egalement les acides nu- 
cleiques contenant une ou plusieurs sequences issues de 
la sequence de l'ADNc du virus HIV-2 ROD. Ces sequences 
reperees par' la numerotation figurant sur la sequence 
precedemment decrite, codent pour certains peptides 



20 



25 



interessants de 


1 1 invention . 








Sequence 


codant 


pour envl nucleotides 


7850 


a 


7927 


ti 


ii 


env2 


8030. 


a 


8095 


it 


it 


env3 " 


7601 


a 


7636 


it 


it 


env4 


6170 


a 


6247 


■I 


ii 


env5 " 


6294 


a 


6349 


it 




envS 


6392 


a 


6445 


it 




env7 


6724 


a 


6763 


it 


•I 


env8 


6794 


a 


6838 


tt 


ii 


env9 


7112 


a 


7162 




ti 


envIO 


7253 


a* 


7336 


ii 


ti 


env11 


7358 


a 


7426 






qaq1 


1535 


a 


1597 




L 1 invention concerne enfin les 


acides nu- 



cleiques correspondants du virus SIV, contenant une ou 
plusieurs sequences issues de l'ADNc du virus SIV-1 . Ces 
sequences codant pour les peptides envl a envl 1 et aaal 
peuvent etre reperes sur la figure 3 par comparaison 
avec les sequences correspondantes decrites pour HIV-2. 
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II va de soi que 1 ' invention concerne les 
acides nucleiques correspondant a des sequences placees 
en des regions analogues des ADNc derives de variants de 
HIV-2 ROD ou de SIV, ainsi que tous les acides nuclei- 
ques dont les modifications vis a vis des precedents 
resulteraient de la raise a profit de la degenerescence 
du code genetique. 

la 1 invention concerne encore les conjugues 
obtenus par couplage covalent des peptides selon 1 1 in- 
vention (ou des susdits oligomeres) a des molecules por- 
teuses (naturelles ou synthetiques ) , physiologiquement 
acceptables et non toxiques, par 1 * intermediaire de 
groupements reactifs complementaires respectivement por- 
tes par la molecule porteuse et le peptide. Des exemples 
de groupements appropries sont illustres dans ce qui 
suit : 

*A titre d'exemple de molecules porteuses ou 
supports macromoleculaires entrant dans la constitution 
des conjugues selon l 1 invention, on mentionnera .des 
proteines naturelles, telles que 1 1 anatoxine tetanique, 
1 1 ovalbulmine , des serums albumines , des hemocyamines , 
etc. . . 

A titre de support macromoleculaires syntheti- 
ques, on mentionnera par exemple des polylysines ou des 
poly (D-L-alanine) -poly(L-lysine) . 

La litterature mentionne d'autres types de 
supports macromoleculaires susceptibles d'etre utilises, 
lesquels presentent en general un poids moleculaire 
super ieur a 20 000. 

Pour synthetiser les conjugues selon 
1' invention, on peut avoir recours a des procedes connus 
en soi, tels que celui decrit par FRANTZ et ROBERTSON 
dans Infect, and Immunity, 3L3, 193-198 (1981), ou celui 
decrit dahs Applied and Environmental Microbiology, 
(octobre 1981), vol. 42, n # 4, 611-614 par P.E. KAUFFMAN 
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en utilisant le peptide et la molecule porteuse appro- 
priee . 

Dans la pratique, on utilisera avanta- 
geusement comme agent de couplage les composes suivants , 
5 cites a titre non limitatif : aldehyde glutarique, 
chlorof ormiate d 1 ethyle , carbodiimides hydrosolubles 
[N-ethyl-N* (3-dimethylamino-propyl) carbodiimide , HC1] , 
diisocyanates, bis-diazobenzidine , di- et trichloro-s- 
triazines, bromures de cyanogene, ainsi que les agents 
10 de couplage mentionnes dans Scand. J. Immunol., (1978), 
vol. 8, p. 7-23 (AVRAMEAS, TERNYNCK, GUESDON) . 

On peut avoir recours a tout procede de 

couplage faisant intervenir d 1 une part une ou plusieurs 

fonctions reactives du peptide et d' autre part, une ou 

. c plusieurs fonctions reactives de molecules supports. 
15 

Avantageusement , il s f agit des fonctions carboxyle et 
amine, lesquelles peuvent donner lieu a "une reaction de 
couplage en presence d ! un agent de couplage du genre de 
ceux utilises dans la synthese des proteines, par 

20 exemple , le 1 -ethyl-3- ( 3-dimethylaminopropyl ) - 

carbodiimide, le N-hydroxybenzotriazole, etc... On peut 
encore avoir recours a la glutaraldehyde, notamraent 
lorsqu'il s ' agit de relier entre eux des groupes amines 
respectivement portes par le peptide et la molecule 

25 support. 

Les peptides selon 1* invention possedent des 
proprietes antigeniques . lis peuvent done etre utilises 
dans des procedes de diagnostic pour la detection d'une 
infection par le virus HIV-2. 

3Q Comme on l'a deja mentionne, des etudes ont 

permis de distinguer deux groupes de peptides pouvant 
etre mis en oeuvre dans des procedes de detection d'an- 
ticorps contre le virus HIV-2 dans un fluide biologique 
humain, notamment un serum ou un liquide cephalo-ra- 

22 chidien. 
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Un premier groupe CD comprend les peptides 
qag ^ . Ces peptides reconnaissent des anticorps anti- 
HIV-2 et sont done capables de detecter une infection 
par HTV-2. lis reconnaissent egalement dans une certaine 
mesure des anticorps anti-HIV-1 . 

Un second groupe (II) comprend des peptides 
qui correspondent plus particulierement a ceux qui sont 
situes dans la partie transmembranaire et dans la fin de 
la partie externe de la proteine d * enveloppe . Ces pep- 
tides sont ceux preced eminent designes par envl . env2 et 
env3 . lis permettent *la reconnaissance specif ique de la 
presence d' anticorps contre HIV-2 et permettent done de 
discriminer chez une personne les infections passees ou 
presentes dues a un HIV, plus particulierement entre 
15 celles qui ont ete provoquees par un HIV-2 et celles qui 
I'onfc ete par un HIV-1 . 

L* invention concerne egalement une composition 
contenant au moins l'un des susdits peptides ou au moins 
un oligomere de ce peptide, caracterisee en ce qu'elle a 
2Q la capacite d'etre reconnue par des serums d'origine hu- 
maine contenant des anticorps contre le virus HIV-2. 

L' invention concerne un procede de diagnostic 
in vitro un ou des peptides selon 1' invention pour la 
detection d' anticorps contre HIV-2 dans des fluides bio- 
25 logiques, en particulier dans des serums humains. 

D'une fagon general e le procede de diagnostic 
in vitro ci-dessus comprend les e tapes suivantes : 

- la mise en contact de ce liquide biologique 
avec lesdits peptides, 
3 Q - la detection de la presence eventuelle d'un 

complexe peptide-anticorps par des methodes physiques ou 
chimiques, dans ledit liquide biologique. 

Dans un mode de realisation prefere de 1' in- 
vention, la detection du complexe antigene-anticorps est 
35 realisee grace a des tests immunoenzymatiques (du type 
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ELISA) , immunof luorescents (du type I FA) , radioimmunolo- 
giques (du type RIA) ou des tests de radioimmunoprecipi- 
tation (du type RIPA) . 

Ainsi 1 ' invention concerne egalement tout peptide selon 
1' invention marque a 1 ' aide d'un marqueur adequat du 
type enzymatique, fluorescent, radioactif, etc... 

De telles methodes comprennent par exemple les 

etapes suivantes : 

depot de quantites determinees d ' une 
composition peptidique selon 1 1 invention dans les puits 
d'une microplaque de titration, 

- introduction dans lesdits puits de dilutions 
croissantes du serum devant etre diagnostique, 

- incubation de la microplaque, 

- ringiages repetes de la microplaque, 

introduction dans les puits de la micro- 
plaque d'anticorps marques contre des immunoglobulines 
du sang, le marquage de ces anticorps ayant ete realise 
a I'aide d 1 une enzyme selectionnee parmi celles qui sont 
capables d'hydrolyser un substrat en modifiant 1' absor- 
ption des radiations de ce dernier, au moins a une lon- 
gueur d'onde determinee, 

detection, en comparaison avec un temoin de 
controle, de la quantite de substrat hydrolyse. 

L 1 invention concerne egalement des cof frets ou 
kits pour le diagnostic in vitro de la presence d'anti- 
corps contre les virus HIV-2 et, dans certains cas, 
HIV-1 dans un milieu biologique qui comprennent : 

- une composition peptidique selon 1 1 inven- 
tion, 

les reactifs pour la constitution du milieu 
propice a la realisation de la reaction immunologique, 

- les reactifs permettant la detection du com- 
plexe antigenes-anticorps produit par la reaction im- 
munologique. De tels reactifs peuvent egalement porter 
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un iaarqueur, ou etre susceptibles d'etre reconnus a leur 
tour par un reactif marque. Plus particulierement dans 
le cas ou la composition polypeptidique sus-mentionnee 
n'est pas marquee. 

- un tissu fluide biologique de reference de- 
pourvu d'anticorps reconnus par la composition polypep- 
tidique sus-mentionnee , 

L ' invention concerne les anticorps eux-memes 
formes centre les pep-tides de 1' invention, 

XI va de soi que cette production n'est pas 
limitee aux anticorps polyclonaux. 

Elle s 1 applique encore a tout anticorps mono- 
clonal produit par tout hybridome susceptible d'etre 
forme, par des methodes classiques, a partir des cel- 
lules spleniques d'un animal, notamment de souris ou de 
rat f immunises contre I'un des peptides de 1" invention, 
d' une part et des cellules d'une lignee de cellule 
myelome approprie d' autre part, et d'etre selectionne, 
par sa capacite a produire des anticorps monoclonaux 
reconnaissant le peptide initialement mis en oeuvre pour 
1 1 immunisation des animaux. 

L 1 invention concerne egalement des composi- 
tions immunogenes pour la production de vaccins dont le 
principe actif est constitue par au moins un peptide 
selon 1' invention, ou un oligomere de ce peptide, ou un 
peptide sous forme conjuguee avec une molecule porteuse, 
caracterisees en ce qu'elles induisent la production 
d'anticorps contre les susdits peptides en quantite suf- 
fisante pour aussi inhiber les proteines du retrovirus 
HIV-2, voire meme le retrovirus HIV- 2 entrant en asso- 
ciation avec un vehicule pharmaceutiquement acceptable. 

Les compositions immunogenes pour la produc- 
tion de vaccins comprennent de fagon avantageuse plus 
particulierement au moins 1 ' un des peptides precedemment 
35 designes par env4, env5, env6 f env7 , env8 , env9 , envlO . 
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envl 1 voir des melanges de ceux-ci. 

Parmi ces peptides aptes a constituer des 
principes actifs de vaccins certains sont particulie- 
rement preferes car ils possedent une structure de base 
en acides amines correspondant a des regions des glyco- 
proteines d'enveloppe qui presentent un important degre 
de conservation, non seulement dans les HIV-2, et dans 
les SIV, mais egalement dans les HIV-1. Ces peptides 
particulierement preferes sont les peptides designes par 
env4, certains peptides env5, env6 et envlQ . 

Dans un mode de realisation prefere de 1 1 in- 
vention les peptides immunogenes (ou fragments de ces 
peptides) aptes a constituer des principes actifs de 
vaccins sont choisis parmi ceux dont les formules cor- 
respondent a des sequences qui f dans les glycoproteines 
d'enveloppe de HIV-2 , SIV et HIV-1 presentant une 
homologie en acides amines superieure a 50% f qui appar,- 
tiennent a la par tie externe.de l'enveloppe du virus, 
qui sont depourvus ou presque de deletions, et qui ren- 
ferment des residus de cysteine favorables a la stabili- 
sation des liaisons et a la constitution de boucles 
d 1 ancrage . 

Les peptides suivants appartiennent a cette 
categorie de peptides preferes. 
env4 

XVTV-YGVP-W--ATZ 
env5 

XL-NVTE-FZ 
env6 

XKPCVKL-PLC-Z 
envl 
XN-S-I-Z 
env10 

XNC-GEF-YC-Z 



35 



WO 88/05440 



PCT/FR88/0002S 



10 



15 



20 



25 



30 



35 



34 

envl 1 
XC-I-Q-IZ 

Des compositions pharmaceutiques avantageuses 
sont constituees par des solutions, suspensions ou li- 
posomes injectables contenant une dose efficace d'au 
moins un produit selon 1' invention. De preference, ces 
solutions, suspensions ou liposomes sont realises dans 
une phase aqueuse sterilisee isotonique, de preference 
saline ou glucosee. 

L* invention concerne plus particulierement de 
-telle s suspensions, solutions ou forme liposome qui sont 
aptes a etre administrees par injections intradermiques , 
intramusculaires ou sous-cutanees, ou encore par scari- 
fications . 

Elle concerne egalement des compositions phar- 
maceutiques administrables par d'autres voies, notamment 
par voie orale. 

Les compositions pharmaceutiques selon 1 1 in- 
vention, utilisables en tant que vaccins pour etre effi- 
caces dans la production d'anticorps contre le virus 
HIV-2, peuvent a titre d'exemple etre administrees a des 
doses situees entre 10 et 500 pg/3cg, de peptides selon 
1' invention, de preference de 50 a 100 yg/kg. 

Ces doses sont citees a titre d'exemple et ne 
possedent en aucun cas un caractere limitatif . 

Comae on l r a deja indique plus haut les dif- 
f erents peptides qui ont ete definis peuvent comprendre 
des modifications qui n 1 ont pas pour ef f et de modifier 
de fagon fondamentale leurs proprietes immunologiques . 
Les peptides equivalents qui en resultent entrent dans 
le champ des revendications qui suivent. A titre d'exem- 
ples de peptides equivalents on mentionnera ceux dont 
les structures en correspondance avec des regions des 
ADNc d'autres variants de HIV-2 de SIV ou de HIV-1, 
lorsque ces regions ont ete mises en alignement dans des 
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conditions semblables a celles qui ont ete evoquees 
ci-dessus, a propos de HIV-2 ROD, SIV et HIV-1 BRU - A 
titre d'autres de ces peptides, on mentionnera ceux dont 
les structures sont en correspondance avec de telles 
regions dans les ADNc qui ont fait I'objet de depots a 
la CNCM r notamment sous les numeros 1-502, 1-642 (HIV-2 
IRMO), 1-643 (HIV-2 EHO) ainsi que, dans les cas 
appropries, des variants de HIV-1 qui ont fait I'objet 
de depots a la CNCM sous les numeros 1-232, 1-240, 
1-241, 1-550, 1-551. 

Les peptides selon 1 ' invention peuvent encore 
etre definis par les formules suivantes (dans lesquels 
X, Z et les tirets ont les significations sus-indi- 

quees) : 
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XRV-AIEKYL-DQA-LN-WGCAFRQVCZ 
XAIEKYL-DZ 

X-LE-AQIQQEKNMYELQKLNSWZ 
XQIQQEKNZ 

XELGDYKLVEITP IG- APT — KR Z 

XYKLVE ITP I G-APT — KRZ 

X VTV-YGVP-W — AT — LFCA-Z 

XVTV-YGVP -W — ATZ 

X E — L -NVTE- F — W-NZ 

XL-NVTE-FZ 

XL S-KPCVKL-PLC Z 

XKPCVKL-PLC-Z 
XS-KPCVKL-PLC-Z 

X N-S-I C-Z 

XN-S-I-Z 

XYC-P-G-A-L-C-N-TZ 

x A-C W--Z 

NKRPRQAWCWFKG-KWKD 

X-G-DPE NC-GEF-YC NZ 

x C-I-Q-I-- G YZ 
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• L 1 invention concerne egalement outre les pep- 
tides de SIV deja decrits , les proteines codees par 
l'ADNc du virus SIV. Elle concerne egalement les pro- 
teines de tout virus immunologiquement etroitement ap- 
parente a SIV-1mac, en particulier tout virus dont les 
proteines et les glycoproteines d'enveloppe croisent 
immunologiquement et dont les ADNc presentent un pour- 
centage d'homologie d'au moins 95% et de preference d 1 au 
moins 98%. 

En particulier 1 ' invention concerne : 
1/ les proteines et glycoproteines de I'enveloppe codees 
par le gene env et representees a la figure 3, 
2/ la proteine GAG representee a la figure 4, 
3/ la proteine POL representee a la figure 5 f 
4/ la proteine Q representee a la figure 6, 
5/ la proteine R representee a la figure 7, 
6/ la proteine X representee a la figure 8, 
7/ la proteine F representee a la figure 9, 
8/ la proteine TAT representee a la figure 10 , 

Les acides amines des proteines precitees de 
SIV, ont ete representees en alignement avec les se- 
quences d' acides amines des proteines correspondantes du 
virus HIV-2 ; les points verticaux figurant entre les 
deux sequences correspondent aux acides amines communs 
entre les proteines des deux* virus. 

Les sequences d 1 ADNc codant pour les proteines 
precitees apparaissent sur la figure 1B. L 1 invention 
concerne, outre les sequences nucleiques precitees toute 
sequence nucleiques modifiee, qui code egalement pour 
les proteines du retrovirus SIV ou d'un variant. 

Ces sequences d 1 ADNc reperees par la numerota- 
tion figurant sur les sequences decrites precedemment 
(figure 1B) sont les suivantes : 
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-sequence codant pour GAG , nucleotides 551 a 2068 

POIr , " 1726 a 4893 

Q, " 4826 a 5467 

- ,r X, " 5298 a 5633 

R, " 5637 a 5939 

- " F r " 8569 a 9354 

TAT-1 " 5788 a 6084 

" " ART- 1 " 6014 a 6130 

TAT- 2 " 8296 a 8391 

ART -2 " 8294 a 8548 

ENV " 6090 a 8732 

L ' invention concerne done naturellement les 
proteines precedemnient decrites , lorsqu'elles sont 
obtenues a partir du virus SIV ou lorsqu'elles sont 
preparees par une methode de synthese, notamment par 
1 ' une des methodes deja citees en rapport avec la syn- 
these des peptides de plus petite taille. 

L' invention concerne egalement 1 ' utilisation 
des proteines precedentes pour le diagnostic de la pre- 
sence eventuelle d'anticorps diriges contre les pro- 
teines de HIV-2, voire contre HIV-2 en entier, ou pour 
certaines d'entre elles 1 ' utilisation aux fins de dia- 
gnos-tic d'une infection due a l*un des virus HIV. Ainsi 
le peptide GAG code par le gene correspondant peut etre 
utilise pour reperer la presence eventuelle d'anticorps 
anti-HlV-1 ou anti-HI\r-2. Les proteines ENV sont utili- 
sees de preference pour le diagnostic specif ique d'une 
infection due a HIV-2 ou un de ses variants, parfois 
pour le diagnostic d'une infection par HIV-2 ou HIV-1 . 

L 1 invention concerne done egalement un procede 
de diagnostic in vitro de detection d'anticorps contre 
HIV-2 et eventuellement contre HIV-1 dans des fluides 
biologiques et en particulier dans des serums humains . 
De tels procedes applicables pour 1 1 utilisation des pro- 
35 teines precedentes de SIV comme proteines de diagnostic, 
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ont deja ete decrits dans la presente invention. 

L ' invention concerns aussi des cof frets ou 
"kits" pour le diagnostic in vitro de la presence d'an- 
ticorps le virus HIV-2 et dans certains cas contre HIV-1 
dans un milieu biologique. De tels kits mettant en oeu- 
vre les peptides precedents ont egalement ete decrits 
dans la presente invention, 

L 1 invention concerne egalement des composi- 
tions immunogenes pour la production de vaccins , dont le 
principe actif est constitue de fagon avantageuse par au 
moins la partie de la proteine ENV du virus SIV, cette 
proteine pouvant etre sous forme conjuguee avec une mo- 
lecule porteuse. Ces compositions immunogenes induisent 
la production d'anticorps contre le susdit peptide en 
quantite suffisante pour inhiber les proteines du re- 
trovirus HIV-2, voire le retrovirus HIV-2 lui-meme. 

Toutefois 1 'utilisation aux fins de diagnostic 
des proteines de SIV n'est en rien limitee a celle des 
seuls proteines ENV ou GAG . D'autres proteines parmi 
celles decrites peuvent etre envisagees, pour preparer 
des compositions de diagnostic voire de vaccin. 
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REVEND I CAT IONS 

1 / Peptide ayant des proprietes immunologiques en 

commun avec celles de L'ossature peptidique de la glyco- 
proteine d 1 enveloppe des virus de la classe HIV-2, ca- 
racterise en ce qu r il a egalement une structure pepti- 
dique en commun avec l'ossature peptidique de la glyco- 
proteine de SIV. 1 . 

2/ Peptide ayant des proprietes immunologiques en 

commun avec celles de l'ossature peptidique de la 
glycoproteine d 1 enveloppe des virus de la classe HIV-2, 
ces -peptides contenant un nombre de residus d' acides 
amines n* excedant pas 40, caracterise en ce qu'il a 
egalement une structure peptidique en commun avec 
l'ossature peptidique de la glycoproteine de SIV.1. 
3/ Peptide selon la revendication 2 caracterise 

par 1 1 une des f ormules : 
XRV- AI EKY L -DQ A- LN- WGC AFRQVC Z 
XAIEKYL-DZ 

dans laquelle- X et Z sont des groupements OH ou NH^ ou, 
dans la mesure ou les proprietes immunologiques du 
peptide depourvu de ces groupes ne s'en trouvent pas es- 
sentiellement modifiees, des groupes comportant de 1 a 5 
residus d* acides amines, et chacun des tirets correspond 
a un residu aminoacyle choisi parmi ceux qui permettent 
de conserver au peptide sus-defini les proprietes immu- 
nologiques de I 1 une des sequences suivantes : 
RVTAIEKYLQDQARLNSWGCAFRQVC 

AIEKYLQDQ 
RVSAIEKYLKDQAQLNAWGCAFRQVC 
AIEKYLKDQ 

4/ Peptide selon la revendication 2 caracterise 

par 1 'une des f ormules : 
. X-LE-AQIQQEKNMYELQKLNSWZ 
XQIQQEKNZ 

35 dans laquelle Xet Z sont des groupements OH ou NH 2 ou, 
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dans la mesure ou les proprietes immunologiques du 
peptide depourvu de ces groupes ne s'en trouvent pas es- 
sentiellement modifiees, des groupes comportant de. 1 a 5 
residus d ' acides amines, et chacun des tirets correspond 
a un residu aminoacyle choisi parmi ceux qui permettent 
de conserver au peptide sus-defini les proprietes immu- 
nologiques de l'une des sequences suivantes : 
SLEQAQIQQEKNMYELQKLNSW 

QIQQEKN 
LLEEAQIQQEKNMYELQKLNSW 

5 / Peptide selon la revendication 2 caracterise 
par l'une des formules : 
XELGDYKLVEITPIG-APT--KR Z 

XYKLVE I T P I G - APT — KRZ 
dans laquelle X et Z sont des groupements OH ou NH 2 ou, 
dans la mesure ou les proprietes immunologiques du 
peptide depourvu de ces groupes ne s 1 en trouvent pas es- 
sentiellement modifiees, des groupes comportant de 1 a 5 
residus d' acides amines, et chacun des tirets correspond 
a un residu aminoacyle choisi parmi ceux qui permettent 
de conserver au peptide sus-defini les proprietes immu- 
nologiques de l'une des sequences suivantes : 
ELGDYKLVEITPIGFAPTKEKRYSSAH 

YKLVEITPIGFAPTKEK 
ELGDYKLVE I T P IGLAPTNVKR YTTG - 

YKLVEITPIGLAPTNVK 
6/ Peptide selon la revendication 2 caracterise 

par l'une des formules : 
X VTV-YGVP-W--AT--LFCA-Z 

XVTV-YGVP-W--ATZ 
dans laquelle X et Z sont des groupements OH ou NH 2 ou, 
dans la mesure ou les proprietes immunologiques du 
peptide depourvu de ces groupes ne s'en trouvent pas es- 
sentiellement modifiees, des groupes comportant de 1 a 5 
residus d' acides amines, et chacun des tirets correspond 
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a un residu aminoacyle choisi parmi ceux qui permettent 
de conserver'au peptide sus-defini les proprietes immu- 
nologiques de l'une des sequences suivantes : 
CTQ YVTVFYGVPTWKNAT I PLFCAT 

VTVFYGVPTWKNAT 
CIQYVTVFYGVPAWRNAT I PLFCAT 

VTVFYGVPAWRNAT 
EKLWVTVYYGVPVWKEATTTLFCAS 

VTVYYGVPVWKEAT 
7/ Peptide selon la revendication 6 caracterise 

par l'une des formules : 
CTQYVTVFYGVPTWKNAT IPLFCAT 

VTVFYGVPTWKNAT 
CIQYVTVFYGVPAWRNATIPLFCAT 

VTVFYGVPAWRNAT 
EKLWVTVYYGVPVWKEATTTLFCAS 

VTVYYGVPVWKEAT 
EDLWVT V Y YGVP VWKEAT TTLF CAS 

VTVYYGVPVWKEAT 
DNLWVTVYYGVPVWKEATTTLFCAS 

VTVYYGVPVWKEAT 
8/ Peptide selon la revendication 2 caracterise 

par l'une des formules : 

X -E — L-NVTE-F — W-NZ 

XL-NVTE-FZ 

dans laquelle X et Z sont des groupements OH ou NH 2 ou, 
dans la mesure ou les proprietes immunologiques du 
peptide depourvu de ces groupes ne s ' en trouvent pas es- 
sentiellenient modif iees , des groupes comportant de 1 a 5 
residus d'acides amines, et chacun des tirets correspond 
a un residu aminoacyle choisi parmi ceux qui permettent 
de conserver au peptide sus-defini les proprietes immu- 
nologiques de l'une des sequences suivantes : 
DDYQEITL-NVTEAFDAWNN 
L-NVTE 
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DDYSELAL-NVTESFDAWEN 
PNPQEVVLVNVTENFNMWKN 
LVNVTE 

9/ Peptide selon la revendication 8 caracterise 

par l'une des formules : 

DDYQEITL-NVTEAFDAWNN 

L-NVTEAF 
DDYSELAL-NVTESFDAWEN 

L-NVTESF 
PNPQEVVLVNVTENFNMWKN 

LVNVTENF 
PNPQEI ELENVTEGFNMWKN 

LENVTEGF 
PNPQEI ALENVTENFNMWKN 

LENVTENF 

10/ Peptide selon la revendication 2 caracterise 

pax l'une des formules : 

XL S-KPCVKL-PLC Z 

XKPCVKLTPLCVZ 

XS-KPCVKLTPLCVZ 
dans laquelle X et Z sont des groupements OH ou NH 2 ou, 
dans la mesure ou les proprietes immunologiques du pep- 
tide depourvu de ces groupes ne s ' en trouvent pas essen- 
tiellement modifiees, des groupes comportant de 1 a 5 
residus d'acides amines, et chacun des tirets correspond 
a un residu aminoacyle choisi parmi ceux qui permettent 
de conserver au peptide sus-defini les proprietes immu- 
nologiques de l'une des sequences suivantes : 
LFETSIKPCVKLTPLCVAMK 
LFETSIKPCVKLSPLCITMR 
LWDQSLKPCVKLTPLCVSLK 

KPCVKLTPLCV 

KPCVKLSPLCI 
SLKPCVKLTPLCV 
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11/ Peptide selon la revendication 10 caracterise 

pax l'une des structures suivantes : 

LFETSIKPCVKLTPLCVAMK 

LFETSTKPCVKLSPLCITMR 

LWDQSLKPCVKLTPLCVSLK 

LWDQSLKPCVKLTPLCVTLN 

PCVKLTPLCV 

KPCVKLSPLCI 

12/ Peptide selon la revendication 2 caracterise 

en ce qu'il contient la structure de base : 

X N-S-I C-Z 

XN-S-I-Z 

dans laquelle X et Z sont des groupements OH ou NH 2 ou, 
dans la mesure ou les proprietes immunologiques du 
peptide depourvu de ces groupes ne s ' en trouvent pas es- 
sentiellement modifiees, des groupes comportant de 1 a 5 
residus d'acides amines, et chacun des tirets correspond 
a un residu aminoacyle choisi parmi ceux qui permettent 
de conserver au peptide sus-defini les proprietes immu- 
nologiques de l'une des sequences suivantes : 
NHCNTSVITESCD 

NTSVIT 
NHCNT S VIQ EC CD 

NTSVIQ 
TSCNTSVITQACP 

NTSVIT 

13/ Peptide selon la revendication 12 caracterise 

par 1 ' une des f ormules suivantes : 

NHCNTSVITESCD 

NTSVIT 
NHCNT SVIQECCD 

NTSVIQ 
TSCNTSVITQACP 

NTSVIT 
INCNTSVITQACP 
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NTSVIT 
INCNTSAITQACP 
NTSAIT 

14/ Peptide selon la revendication 2 caracterise 

par l'une des formules suivantes : 
XYC-P-G-A-L-C-N-TZ 

dans laquelle X et Z sont des groupements OH ou NH^ ou, 
dans la mesure ou les proprietes immunologiques du 
peptide depourvu de ces groupes ne s'en tiouvent pas es- 
sentiellement modifiees, des groupes comportant de 1 a 5 
residus d'acides amines, et chacun des tirets correspond 
a un residu aminoacyle choisi parmi ceux qui permettent 
de conserver au peptide sus-defini les proprietes immu- 
nologiques de l'une des sequences suivantes : 
1 5 YCAPPGYALLRC-NDT 
YCAPAGFAILKCNNKT 

15/ . Peptide selon la revendication 14 caracterise 

par l'une des formules : 
YCAPPGYALLRC-NDT 
YCAPAGFAILKCNNKT 
YCAPAGFAILKCNDKK 
YCAPAGFAILKCRDKK 

16/ Peptide selon la revendication 2 caracterise 

par la formule : 
x A-C W--Z 

dans laquelle X et Z sont des groupements OH ou NH 2 ou, 
dans la mesure ou les proprietes immunologiques du 
peptide depourvu de ces groupes ne s'en trouvent pas es- 
sentiellement modifiees, des groupes comportant de 1 a 5 
residus d ' acides amines, et chacun des tirets correspond 
4 un residu aminoacyle choisi parmi ceux qui permettent 
de conserver au peptide sus-defini les proprietes immu- 
nologiques de l'une des sequences suivantes : 
NKRPRQAWCWFKG-KWKD 
35 NERPKQAWCRFGG-NWKE 
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N- -MRQAHCN I SRAKWNA 

17/ Peptide selon la revendication 16 caracterise 

par la formula suivante : 

NKRPRQAWCWFKG-KWKD 

NERPKQAWCRFGG-KWKE 

N — MRQAHCNI SRAKWNA 

D — IRRAYCTINETEWDK 

I — IGQAHCNISRAQWSK 

18/ Peptide selon la revendication 2 caracterise 

par la formule suivantes : 

X-G-DPE NC-GEF-YC- NZ 

XNC-GEF-YC-2 

dans laquelle X et Z sont des groupements OH ou N^ ou, 
dans la mesure ou les proprietes immunologiques du 
peptide depoUrvu de ces groupes ne s ' en trouvent pas es- 
sentiellement modifiees, des groupes comportant de 1 a 5 
residus d'acides amines, et chacun des tirets correspond 
a un residu aminoacyle choisi parmi ceux qui permettent 
de conserver au peptide sus-defini les proprietes immu- 
nologiques de l'une des sequences suivantes 
KGSDPEVAYMWTNCRGEFLYCNMTWFLN 

NCRGEFLYCN 
GG -DPEVTFMWTNCRGEFLYCKMNWFLN 

NCRGEFLYCK 
-GGDPEIVTHSFNCGGEFFYCNSTQLFN 

NCGGEFFYCN 

19/ Peptide selon la revendication 18 caracterise 

par l'une des structures suivantes : 
KGSDPEVAYMWTNCRGEFLYCNMTWFLN 

NCRGEFLYCN 
GG -DPEVTFMWTNCRGEFLYCKMNWFLN 

NCRGEFLYCK 
-GGDPEIVTHSFNCGGEFFYCNSTQLFN 

NCGGEFFYCN 
-GGDPEITTHSFNCRGEFFYCNTSKLFN 
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NCRGEFFYCN 
-GGDPEITTHSFNCGGEFFYCNTSGLFN 
NCGGEFFYCN 

20/ Peptide selon la revendication 2 caracterise 

par l'une des formules suivantes : 

x c-I-Q-I G YZ 

XC-I-Q-IZ 

dans laque'lle X et Z sont des groupements OH ou NH 2 ou, 
dans la mesure ou les proprietes immunologiques du 
peptide depourvu de ces groupes ne s ' en trouvent pas es- 
sentiellement modifiees, des groupes comportant de 1 a 5 
residus d'acides amines, et chacun des tirets correspond 
a un residu aminoacyle choisi parmi ceux qui permettent 
de conserver au peptide sus-defini les proprietes immu- 
nologiques de l'une des sequences suivantes : 
RN Y AP CH i KQ I INTWHKVGRNVY 

CHIKQII 
RNYVPCH IRQ I INTWHKVGKNVY 

CHIRQII 
TITLPCRIKQFINMWQEVGKAMY 

CRIKQFI 

21/ Peptide selon la revendication 20 caracterise 

par 1 ' une des structures, suivantes : 
RN YAP CHIKQI INTWHKVGRNVY 

CHIKQII 
RNYVPCHIRQII NT WHK VGKNVY 

CHIRQII 
TITLPCRIKQFINMWQEVGKAMY 

CRIKQFI 
SITLPCRIKQIINMWQKTCKAMY 

CRIKQII 
NITLQCRIKQIIKMVAGR-KAIY 

CRIKQII 

22/ Peptide antigenique aaal . caracterise par 

l'une des structures de base : 
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XDCKLVLKGLGMNPTLEEMLTAZ 
XDCKLVLKGLGTNPTLEEMLTAZ 

dans lesquelles X et Z sont des groupements OH ou NH^ 
ou, dans la mesure ou les proprietes immunologiques du 
peptide depourvu de ces groupes ne s 1 en trouvent pas es- 
sentiellement modifiees, des groupes comportant de 1 a 5 
residus d'acides amines, et dans lesquelles chacun des 
tirets correspond a un residu aminoacyle choisi parmi 
ceux qui permettent de conserver au peptide sus-def ini 
les proprietes immunologiques de I'une ou 1 ' autre des 
sequences suivantes : 
DCKLVLKGLGMNPTLEEMLTA 
DCKLVLKGLGTNPTLEEMLTA 

23/ Sequence nucleotidique caracterisee en ce 

qu'elle renferme tout ou partie de la sequence d'acides 
nucleiques definie a la figure 1B. 

24/ Sequence nucleotidique caracterisee en ce 

qu'elle renferme tout ou partie de la sequence d'acides 
nuclei ques definie a la figure 1C. 

25 / Sequence nucleotidique selon la revendication 

23, caracterisee en ce qu'elle comprend les sequences 
nucleotidiques : 

GAG s' etendant entre les nucleotides 550 a 2068 



POL w " " 1726 a 4893 

25 q - " " " 4826 a 5467 

X 11 " H 5298 a 5633 

r ■ » M 5637 a 5939 

F " " " 8569 a 9354 

TAT-1 " " " 5788 a 6084 

30 ART - 1 " " " 6014 a 6130 

TAT -2 " " " 8296 a 8391 

ART -2 " " " 8294 a 8548 

LTR " " ■ 8950 a 9468 et 

1 a 316 

ENV " ■ " 6090 a 9732 
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26/ Peptide ayant une structure peptidique en 

commun avec l'ossature peptidique de SIV-1, caracterise 

en ce qu'il comprend tout ou partie des sequences d 1 a- 

cides amines parmi les sequences suivantes : 

ENV representee a la figure 3 

GAG " " 4 

POL " " 5 

Q " "6 

R " "7 

X "8 

F " 9 

TAT M " 10 

ART " " 11 

27 / Acide nucleique recombinant caracterise en ce 

qu'il comprend la totalite ou une partie d'un ADNc selon 
l'une quelconque des revendications 23 a 25, insere dans 
un acide nucleique provenant d'un vecteur . 
28/ Acide nucleique recombinant selon la reven- 

dication 27, caracterise en ce qu'il est marque. 
29/ Composition antigenique contenant le peptide 

aaa selon la revendication 26 ou 27, au moins un peptide 
aaa1 selon la revendication 22 ou au moins un oligomere 
de ce peptide, caracterisee en ce qu'elle a la capacite 
d'etre reconnue par des fluides biologiques d'origine 
humaine, notamment des serums contenant des anticorps 
anti-HIV-2 et dans une certaine mesure des anticorps 
anti-HIV-1 . 

30/ Composition antigenique contenant le peptide 

env selon la revendication 26 ou au moins un peptide se- 
lon les revendications 3, 4 et 5 ou au moins un oligo- 
mere de ce peptide, caracterisee en ce qu'elle recon- 
naissent specif iquement la presence d* anticorps contre 
HIV-2. 

31/ Composition iramunogene contenant tout ou par- 

tie du peptide env selon la revendication 26 ou au moins 
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un peptide ou au mains un oligomere de ce peptide ou ce 
peptide sous forme conjuguee avec une molecule porteuse, 
selon les revendications 6 a 21, en association avec un 
.vehicule pharmaceutique acceptable pour la production de 
vaccins, caracterisee en ce qu'elle induit la production 
d'anticorps contre les susdits peptides en quantite suf- 
fisante pour inhiber ef f icacement les proteines du re- 
trovirus HIV-2, voire meme le retrovirus HIV-2 entier. 
32/ Composition immunogene selon la revendication 

31 caracterisee en ce quelle contient les peptides dont 
les formules correspondent a des sequences qui, dans les 
glycoproteines d'enveloppe de HIV-2, SIV-1 et HIV-1 
presentent une homologie en acides amines superieure a 
50%. 

33/ Composition immunogene selon l'une des reven- 

dications 31 ou 32, caracterisee en ce qu'elle contient 
au moins un peptide ou au moins un oligomere de-ce pep- 
tide ou ce peptide sous forme conjuguee avec une mole- 
cule porteuse choisi parmi env4, envS , env6 et envlQ. 
34/ Procede de diagnostic in vitro de l 1 infection 

par HIV-2 dans un liquide biologique comprenant : 

la mise en contact de ce liquide biologique 
avec au moins un peptide selon l'une des revendications 
1, 2, 3, 4, 5, 22 ou un conjugue de ces peptides avec 
une molecule porteuse ou des peptides gag ou env selon 
la revendication 26. 

- la detection de la presence eventuelle d'un 
complexe antigene-anticorps par des methodes physiques 
ou chimiques, dans ledit liquide biologique. 
35/ Procede de diagnostic in vitro de 1 1 infection 

par HIV-2 dans un liquide biologique selon la revendi- 
cation 34 r caracterise en ce que la detection du com- 
plexe antigene-anticorps eventuellement forme est rea- 
lisee grace a des tests immunoenzymatiques (du type 
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ELISA) immunof luorescents (du type IFA) radioimmunolo- 
giques (du type RIA) ou des tests de radioimmunopxeci- 
pitation (du type RIPA) . 

36/ Kit pour le diagnostic in vitro de 1 ' infection 

par HIV-2 dans un liquide biologique caracterise en ce 

qu'il comprend ; 

une composition peptidique contenant un peptide selon 
l'une des revendications 1 a 5, 22, ou un melange de ces 
peptides, ou un conjugue de ces peptides avec une mole- 
cule porteuse, ou les peptides gag ou env selon la 
revendication 26, 

- un reactif pour la constitution du milieu propice a la 
realisation d' une reaction immunologique , 

- un ou plusieurs reactifs £ventuellement marque pour la 
detection du complexe antigene-anticorps forme par la 
reaction immunologique, 

- un liquide biologique de reference depourvu d* anti- 
corps reconnus par la susdite composition peptidique. 
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HI V2 . ROD 
> R 

G T CGC TC TGC G G AG A GG C TGGC AG AT T G AG CCCTGGGAGGTTCTCTCC AG C AC TAGC A CG 

TAGAGCC TGG G TGTTCCCTGCTAG AC TCTCACC A GCACTTGGCCG G TGC TGGGC AG AC GG 

100 R 1 us 

CCCCACGCTTGCTTGCTTAAAAACCTCTT AATAAA. GCTGCCAGTTAGAAGCiAGTTAAGT 

**• • • * • 

GTCTGC TCCCATCTCTCCTAGTCGCCGCC TGGTCATTCGGTGTTCACCTGAGTAACAAGA 

200 • . 

OCCTGGTCTGTTAGGACCCTTCTTGCTTTGGGAAACCGAGGCAGGAAAATCCCTAGCAGG 

300 

TTGGCGCC TGAACAGGGACTTGAAGAAGACTGAGAAGTCTTGGAACACGGCTGAGTGAAG 

• • • * 

GCAGTAAGGGCGGCAGGAACAAACCACGACGGAGTGCTCCTaGAAAGGCGCGGGCCGAGG 

400 . 

CACCAAAGGCAGCGTGTGGAGCGGGAGGAGAAGAGSCCTCCGGGT^AAGGTAAGTACCTA 

CACCAAAAACTGTAGCCGAAAGGGCTTGCTArCCTAwCTT'C AC A.T^ GGTA.GAAGATTGTG 

500 - 

MetGlyAlaArgAsnSerValLeuArgGlyLyaLyjAlaAspcnyLeuGluArgI le 
GGAGATGGGCGCGAGAAACTCCGTCTTGAGAGGGA^ AAA A.GC AGaTGAAT T AGAAAGAAT 

600 

ArgLeuArgProGlyGlyLysLysLysTyrArgL^LysHicI 1 e Ya lTr ?A la AlaAsn 
CAGGTTACGGCCC GGCGGAAAGAAAAAGTACAGGCTAAAAvATATTGTGTGGGCAGCGAA 

LysLeuAspArgPheGlyLeuAlaGluSerLeuLeuGiuSerLysCIuGlyCysGlnLys 
rAAATTGGACAGATTCGGATTAGCAGAGAGCCTGTTGGAGTCAAAAGAGGGTTGTtAAAA 

700 

I leLe uThr Va lLeuAspProMet Va IProThr G ly Ser GluAs nLeuLy3 Ser LeuPhe 
AATTCTTACAGTTTTAGATCCAATGGTACCGACAGGTTCAGAAAATTTAAAAAGTCTTTT 

AsaThrValCysVallleTrpCysIleKisAlaGluGIuLysVal Lys As pTfcrG luG ly 
7AATACTGTCTGCGTCATTTGGTGCATACACGCAGAAGAGAAAGTGAAAGATAC iGAAGG 

800 • • • 

AlaLysGlnl le7a lArgArgHiaLeuValAlaGluThrGlyThrAlaGluLysHe tPro 
AGCAAAACAAATACTGCGGACACATCTAGTGGCAGAAACAGGAACTGCAGAGAAAATGCC 
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SerThrSerArgProThrAUProSerSerGluLysClyGlyAsnTyrProValGlnHis 
AAGCACAAGTAGACC AACAGC ACCATCTAGCG AGAAGCCAGG AAATTACCC AGTGCAACA 

ValGlyGlyAsnTyrThrHisIleProLeuSerProArgThrLeuAsnAlaTrpValLys 
TGTAGGCGGCAACTACACCCATATACCGCIGAGTCCCCGAACCCTAAATGCCTGGGTAAA 

LeuValGluGluLysLysPheGlyAlaGiuValValProGlyPh^ 
ATTAGTAGAGGAAAAAAAGTTCGGGGCAGAAGTAGTGCCAGGATTTCAGGCACTCTCAGA 

GlyCysThrProTyrAspIleAsnGlnMetLeuAsnCysValGlyAspHisGlnAlaAla 
AGGCTGCACGCCCTATGATATCAACCAAAIGCTTAATTGTGTCGGCGACCATCAAGCAGC 

H00 • • . * 

MetGlallelleArgGluIlelleAsaGluCluAlaAlaGluTrpAspValGlaHiaPro 

CATGCAGATAATCAGGGAGATTATCAATGAGGAAGCAGCAGAATGCGATGTGCAACATCC 

« • • * 

IleProGlyProLeuProAlaGlyGlaLeuArgGluProArgGlySerAspIleAlaGly 
AATACCAGGCCCCTTACCAGCGGGGCAGCTTAGAGAGCCAAGGGGATCTGACATAGCAGG 

ThrThrSerThrValGluGluGlnlleGlnTrpMetPheArgProClnAsnProValPro 
CACAACAAGCACAGTAGAAGAACAGATCCAGTGGAIGTTTAGGCCACAAAATCCTGTACC 

1300 

ValGlyAsnlleTyrArgArgTrpIleGlnlleGlyLeuGlaL^ 
AGTAGGAAACATCTATAGAAGATGGATCCAGATAGGATTGCAGAAGTGTGTCAGGATGTA 

• 

AsnProTh^AaalleLeuAspIleLysGlaGlyProLysGluPr^ 
CAACCCGACCAACATCCTAGACATAAAACAGGGACCAAAGGAGCCGTTCCAAAGCTATGT 

1400 • • ' * 

AapArgPheTyrLysSerLeuArgAlaGluGlnThrAspProAlaValLyaAsnTrpMet 

AGATAGATTCTACAAAAGCTTCAGGGCAGAACAAACAGATCCAGCAGTGAAGAATTGGAX 

ThrGlnTbkeuLeuValGlaAsaAlaAsaProAapCysLysLeuVal^^ 
GACCCAAACACTGCTAGTACAAAATGCCAACCCAGACTGTAAATTAGTGCTAAAAGGACT 

' GlyMetAaaProThrLeuGluGluMetLeuThrAlaCysGlaGlyV^ 
AGGGATGAACCCTACCTTAGAAGAGATGCTGACCGCCTGTCAGGGGGTAGGTGCGCCAGG 

, • . 1600 

GlnLysAlaArgLeuMeUiaGluAlaL^uLy'aGluVallleGlyProAlaPro 
CCAGAAAGCTAGATTAATGGCAGAGGCCCTGAAAGAGGTCATAGGACCTGCCCCTATCCC 

• • • 

PheAlaAlaAlaGlaGlaArgLysAlaPheLysCysTrpAaaCysGlyLys^ 

ATTCGCAGCAGCCCAGCAGAGAAAGGCATTTAAATGCTGGAACTGTGGAAAGGAAGGGCA 

SerAlaArgGlnCyaArjAlaProArgArgGlnGlyCy.TrpLysCysGlyLysProGly 
CTCGGCAAGACAATGCCGAGCACCTAGAAGGCAGGGCTGCTGGAAGTGTGGTAAGCCAGG 

ThrGlyArgPaePheArgThrGlyProLeuCly 
HialleMetThrAanCyaProAapArgGlnAlaGlyPheLeuGlyLeuGlyProTrpGly 
ACACATCATGACAAACTGCCCAGATAGACAGGCAGGTTTTTTAGGACTGGGCCCTTGGGG 

. • • 

LyaGluAlaProGlaLeuProArgGlyProSerSerAlaGlyAlaAapThrAsnSerTbr 

LyaLyaProArgAsnPheProValAlaGlaValProGiaGlyLeuThrProThr^ 
AAAGAAGCCCCGCAACTTCCCCGTGGCCCAAGTTCCGCAGGGGCTGACACCAACAGCACC 

. 1900 

ProSerGlySerSerSerGlySerThrGlyGluIleTyrAlaAlaArgGluLy.ThrGlu 

aA^ProAlaValAspLeuL^uGluLyaTyrM^ 
CCCAGTGGATCCAGCAGTGGAK 



P r o Va 1 Aa p 1 . u , , . . ™ , - ™- - - ^- ATGCAGCAAGGGAAAA GACACAC 



ArgAlaGluArgGluThrlleGlaGlySerAapArgGlyLeuThrAlaProArgAlaGly 

G luGl'nArgG luArgProTyrLyaG iuValThrG luAspLeuLeuHisLe^ 
AGAGCAGAGAGAGAfiACCATACAAGGAAGTGACAGAGGACTTACTGCACCTCGAGCAGCG 

( fig. lA-suite 1) 



WO 88/05440 PCT/FR88/00025 

3/35 

GlyAspThrileGlnGlyAUIhrAsnArgGlyLeuAlaAlaProGlnPheSerLjuTrp 
GluThrProTyrAreCluProProThrGluAspLeuLeuHxsLeuAsnSerLeuPheGly 

GGAGACACCATACAGGGAGCCACCAACAGAGG 

LysArgProklValThrAlaTyrlleGluGlyGUProValGluValLeuLeuAspThr 
AAAAGACCAGTAGTCACAGCATACATTGAGGGTCAGCCAGTAGAAGTCTTGTTAGACACA 

GlyAlaAspAspSerllaValAlaGlylUGluLeuG^ 

GGGGCTGACGACTCAATAGTAGCAGGAATAGAGTTAGGGAACAATTATAGCCC AAAAA1A 

2200 

ValGlyGiyheGlyGLyPhelleAsnThrLysGluTyrLysAanValGluIleGlaVal 
GTAGGGGGAATAGGGGGATTCATAAATACCAAGGAATATAAAAATGTAGAAATAGAAGTT 

m • # 

LeuAsnLysLysValArgAiaThrllaMe^hrGlyAsp^^ 

CTAAATAAAAAGGTACGGGCCAC C ATAATGAC AGGCG ACACCCCAATCAACATTTTTGGv, 

23 00 • * * 

ArgAsnlULeuThrAlaLeuGlyMstSekeuAsnLeuProVa^^ 
AGAAATATTCTGACAGCCTTAGGCATGTCATTAAATCTACCAGTCGCCAAAGTAGAGCCA 

IleLysIleMetLeuLysP^GiyLysAspGlyProLysLeuA^^^ 
ATAAAAATAATGCTAAAGCCAGGGAAAGATGGACCAAAACTGAGACAATGGCCCTTAACA 

^ • * 

LysGluLysileGluAlaLeuLysGluIleCyaG ^ u ^^ 5 p aqq^x 

AAAGAAAAAATAGAAGCACTAAAAGAAATCTGTGAAAAAATGCAAAAACAAGGCCAGCTA 

2500 

GluGluAlaProProThrAsnProTyrAsnThrProThrPhe^ 

GAGGAAGCACCTCCAACTAATCCTTATAATACCCCCACATTTGCAATCAAGAAAAAGGAC 
LysAsnLysTrpArgMetL^uIleAspPheArgGluLeuAso^ 

AAAAACAAATGGAGGATGCTAATAGATTTCAGAGAACTAAACAAGGTAACTCAAGATTTC 
TbrGluIleGlnLeuGlylleProHisPr^AlaGlyLeuAla^ 

ACAGAAATTCAGTTAGGAATTCCACACCCAGCAGGGTTGGCCAAGAAGAGAAGAATTACT 
VAlLeuAsDValGlyAspAlaTyrPheSerlleProLeuHisGluAspPheArgProTyr 

g?1c?a^?g^gggg1?gcttIcttttccataccac 

+ • * 

ThrAlaPheThrLeuProSerValAsnAanALaGluProGlyLysArgTyrlleTyrLys 

Ic^cItt?ac«Sc^xcagtgaacaatgcagaaccaggaaaaagatacatatataaa 

2800 ♦ 

2900 • • * * 

LauIleAlaSerAspArzThrAspLeuGluHisAspArgValValLeuGlnLeuLysGlu 

TTAATAGCTAGTGACAGGAC^^ 

LeuLeuAsnGlyLeuGlyPneSerThrProAspGlu^^ 

CTTCTAAATGGCCTAGGATTTTCTACCCCAGATGAGAAGTTCCAAAAAGACCCTCCATAC 
HisTrpMetGlyTyrGluLeuTrpProTb^ysTrpL^^ 

CACTGGATGGGCTATGAACTATGGCCAACTAAATGGAAGTTGCAGAAAATACAGTTGCCC 

310 0 

GlnLysGluileTrpTbrvIlAaaAspIleGlaLyaLeuValGlyValLeuA^ 
CAAAAAGAAATATGGACAGTCAATGACATCCAGAAGCTAGTGGGTGTCCTAAATTGGGCA 
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AlaGlaLeuIyrProGlyl ULysXhr LysHi s Le uCys AigLeu 1 1 eArgG ly LysMe t 
GCACAACXCXACCCAGGGATAAAGACCAAACACXXAICXAGGIXAAXCAGAGGAAAAAXG 

3200 . 

XhrLeuXhrGluGluValGlnXrpXtarGluLeuAlaGluAlaGluLeuGluGluAaaArg 
ACACTCACAGAAGAAGTACAGTGGACAGAATTAGCAGAAGCAGAGCTAGAAGAAAACAGA 

- . • 3300 

IlelleLeuSerGlnGluGlnGluGlyEiaTyrTyrGlaCluGluLyaGluLeuGluAla 
AIXAICC-TAAGCCAGGAACAACAGGGACACXAXXACCAAGAAGAAAAAGAGCXACAACCA 

^rValClnLysAspGluGluAsnGluTrpThrTyrLysIleHlsGlnGluGluLysIle 
AGAGTCCAAAAGGATCAAGAGAATGAGTGGACATATAAAATACACCAGGAAGAAAAAATT 

LeuLysValGlyLysTyrAlaLys Va lLys AsnXhrHisXhrAanG ly I leArgLeuLeu 
CTAAAAGTAGGAAAATATGCAAAGGTGAAAAACACCCATACCAATGGAATCAGATTGTTA 

AlaGlnValValGlnLysIleGlyLysGluAlaLeuValllelrpGlyArglleProLys 
GCACAGGTAGXICAGAAAATAGGAAAAGAAGCACXAGXCAXIIGGGGACGAAXACCAAAA 

3 500 . 

PheHisLeuProValGluArgGluIleTrpGluGiuTrpTrpAspAaoTyrTrpGlnVal 
TTICACCXACCAGXAGAGAGAGAAAXCTGGGAGCAGIGGXGCGAXAACXACXGGCAAGXC 

3600 

XhrlrpIleProAspIrpAspPheValSerlhrProProLeuValArgLeuAlaPheAsn 
ACAIGGAICCCAGACIGGGACIXCGXGXCXACCCCACCACXGGXCAGGXXAGCGXXXAAC 

.. .. 

LeuValGlyAspProIleProGlyAlaGluXbrPhelyrlbrAspGlySerCysAanArg 
CXGGXAGGGGAICC IAIACCAGGIGCAGAGACCXXCIACACAGAXGGAXCCXGCAAXACG 

3700 

GlnSerLysGluGlyLysAlaGlyXyrVallarAspArgGlyLysAapLya ValLysLya 
CAAICAAAAGAAGGAAAAGCAGGAXAXGXAACAGAXAGAGGGAAAGACAAGGIAAAGAAA 

LeuGluG lnXhrlnrAsaG InG InA laG luLeuG luAlaPheAlaMetAlaLeuXhrAsp 
CXAGAGCAAACXACCAAXCAGCAAGCAGAACXAGAAGCCXXXGCGAICGCACXAACAGAC 

3800 . 

SerGlyProLysYalAsnllelleValAspSerGlnlyrValMetGlylleSerAlaSer 
XCGGGXCCAAAAGXXAAXAIXAIAGXAGACXCACAGIAXGXAAIGGGGAXCAGXGCAAGC 

3900 

GlnProXhrGluSerGluSerLysIleValAsnGlallelleG luG luMetlleLysLya 
CAACCAACAGAGXCAGAAAGXAAAAXAGIGAACCAGAICAIAGAAGAAATGATAAAAAAG 

.is. • • 

GluAlalleXyrValAlalrpValProAlaHisLyaGlylleGlyGlyAsnGlnGluVal 

GAAGCAAICXAXGIIGCAXGGGXCCCAGCCCACAAAGGCAXAGGGGGAAACCAGGAACXA 

4000 

AapHisLeuValSerGlnGlylleArgGlaValLeuPbeleuGlulyelleGluProAla 
GAICAXXIAGIGAGXCAGGGXAICAGACAACXGXXGIXCC.XGGAAAAAATACAGCCCGCX 

GlaGiaGluHisGluLysXyrHisSerAaaValLysGluLeuSerHiaLysPbeGlylle 
CAGGAAGAACAXGAAAAAIAICAIAGCAAIGXAAAAGAACXGXCXCAIAAAXXXGGAATA 

4100 

Pr^AsnLeuValAlaArgGlnlleValAanSerCysAlaGlnCyaGlnGlnLyaGlyGlu 
CCCAAIIXAGXGGCAAGGCAAAIAGXAAACXCAIGIGCCCAAXGXCAACAGAAAGGCCAA 

4200 

AlalleHisGlyGlnValAenAlaGluLeuGlyXhrXrpGlnHetAsp.CysIarlixsLeu 
GCXAIACAX.GGGCAAGIAAAXGCAGAACXAGGCACXIGGCAAAIGGACXGCACACAXXXA 

■ i . « 

GluGlyLyallellelleValAlaValHieValAlaSerGlyP&elleGluAlaGluVal 

GAAGGAAAGAICAIXAIAGXAGCAGXAGAIGXXGCAACXGGAIXXAXAGAAGCAGAACTC 

4300 

IleProGlnGluSerGlyArgGlaXbrAlaLeuPtaeLeuLeuLysLeuAlaSerArgTrp 
ATCCCACAGGAAICAGGAAGACAAACAGCACTCTXCCXAIXGAAACXGGCAAGXAGGXGG 
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ProIleThrHisLeuHisThrAspAanGiyAlaAsnPheThrSerGlaGluVallTysMet 
CCAATAACACACXXGCATACAGAIAAXGGTGCCAACXXCACIXCACAGGACGXCAACAIG 

. 4400 • * * 

ValAUTrpTrpIleGlylleGluGl.nSerPheGlyValProTyrAsaProGlnSerGln 

GTAGCATGGTGGAXAGGTATAGAACAATCCTTXGGAGTACCXTACAAXCCACAGACCCAA 

GlyVolValGluAlaMetAsnHisHiaLeuLysAanGlnlLaSferGluThrlleValLeu 
GGAGTAGTAGAAGCAATGAATCACCATCTAAAAAACCAAATAAGTGAAACAATAGTACTA 

MetAlalleHiaCysMetAaaPheLysArgArgGlyGlylleGlyAapMetThrProSer 
AXGGCAAXICAXXCCAXGAAXIXXAAAAGAAGGGGGGGAAXAGGGGAIAXGACXCCAXCA 

. • 4600 • 

GluArgLeuIleAsnMetlleThrThrGluGlnGluIleGlnPheLeuGlnAlaLysAaa 
GAAAGATTAATCAATATGATCACCACAGAACAAGAGATACAATTCCTCCAAGCC AAAAAT 

SerLysLeuLysAspPheArgValXyrPheArgGluGlyArgAspGlnLeuTrpLysGly 
TCAAAATTAAAAGAITTTCGGGTCTATTTCAGAGAAGGCAGAGATCAGTTGTGGAAAGGA 

4700 • . • . • 

ProGlyGluLeuLeuTrpLysGlyGluGlyAlaValLeuValLysValGlyThrAspIle 

CCIGGGGAACTACTGXGGAAAGGAGAAGGAGCAGICCXAGXCAAGGXACGAACAGACAXA 
LysIlelleProArgArgLysAlaLysIlelleA^ 

AAAATAATACCAAGAAGGAAAGCCAAGATCATCAGAGACTATGGAGGAAGACAAGAGATG 

AspSerGlySerHisLeuGluGlyAlaArgGluAspGlyCluMetAla 

IleValValProThrTrpArgValProGlyArgMetGluLysTrpHisSerLeuValLys 
GAIAGXGGXICCCACCXGGAGGGXGCCAGGGAGGAIGCACAAAXGGCAIAGCCXXGXCAA 

4900 

TyrLeuLyaXyrLysXhrLysAspLeuGluLysValCysIyrValProHisHisLysVal 
GXAXCXAAAAXACAAAACAAAGGAXCXAGAAAAGGXGXCCXAXGXXCCCCACCAIAAGGX 

GlyTrpAlaTrpTrpThrCysSerArgValllePheProLeuLysGlyAsaSerHisLeu 
GGGAXGGGCAXGGXGGACXXGCAGCACGGXAAXAIXCCCAIXAAAAGGAAACAGXCAXCX 

5000 • 
GluIleGlnAlaXyrlrpAsnLeuXhrProGluLysGlyXrpLeuSerSerXyrSerVal 

AGAGAXACAGGCAIAIXGGAACTXAACACCAGAAAAAGGAIGCCXCICCICXXAXXCAGI 

• r> • • • 5ioo 

ArzIlelhrlrpTyrXhrGluLysPheXrpXhrAspValXhrPrbAspCysAlaAapVal 
AAGAAIAACTXGGXACACAGAAAAGXXCXGGACAGAIGIXACCCCAGACIGXGCACAXGX 

• • • • 

LeuIleHisSerThrTyrPheProCysPheThrAlaGlyGluValArgArgAlalleArg 

CCIAAXACAXAGCACXXAIIXCCCXXGCXXXACAGCAGGXGAAGXAAGAAGAGCCAXCAG 

5200 . 

GlyGluLysLeuLeuSerCysCyaAanlyrProArgAlaHiaArgAlaGlnValProSer 
AGGGCAAAAGTTATTGTCCXGCXGCAAIXAICCCCGAGCXCAXAGAGCCCAGGXACCGXC 

LeuGlnPheLeuAlaLeuTalTalValGlnGlnAsnAspArgProGinArgAapSerTbr 

MetXhrAspProArgGluXbrValPr© 
ACITCAAIXXCXGGCCXXAGXGGXAGXGCAACAAAAIGACAGACCCCAGAGAGACAGXAC 

5300 . • • 

TlirArgLysGlnArgArgArgAspTyrArgArgGlyLeuArgLeuAlaLysGlnAspSer 

ProClyAanSerGlyGluGluIfarlleGlyGluAlaPheAlalrpLeuAsttArgXbrVal 

CACCAGGAAACAGCGGCGAAGAGACIAICGGAGAGGCCIXCGCCXGGCXAAACAGGACAG 

5400 

ArgSerHisLyaGlnArgSerSerGluSerProTarProArgThrTyrPheProGlyyal 
GluAlalleAsnArgGluAlaVa lAaaHi.LeuProArgGluLeuIlePheGlnValTrp 
XAGAAGCCAIAAACAGAGAAGCAGXGAAICACCXACCCCGAGAACXXAXXXXCCAGGXGX 
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AlaGluValLeuGluIleLeuAla 
GlnArgSerTrpArgTyrTrpHiaAapGluGlnGlyMetSerGluSerTyrThrLysTyr 

GGCAGAGGTCCTGGAGATACTGGCATGATGAACAAGGGATGTCAGAAAGTTACACAAAGT 

. . . 5500 

ArgTyrLeuCysIlelleGlnLyaAlaValTyrMetHisValArgLysGlyCysTbrCys 

ATAGATATTTGTGCATAATACAGAAAGCAGTGTACATGCATGTTAGGAAAGGGTGTACTT 

LeuGlyArgGlyHisGlyProGlyGlyTrpArgProClyProProProProProProPro 
GCCTGGGGAGGGGACATGGGCCAGGAGGGTGGAGACCAGGGCCTCCTCCTCCTCCCCCTC 

5600 • 
MetAlaGluAlaProThrGluLeuProPrpValAepGlyThrProLeu 

GlyLeuVal*** 

CAGGTCTGGTCTAATGGCTGAAGCACCAACAGAGCTCCCCCCGGTGGATGGGACCCCACT 

ArgGluProGlyAspCluTrpIlelleGluIleLeuArgGluIleLyeGluGluAlaLeu 
GAGGGAGCCAGGGGATGAGTGGATAATAGAAATCTTGAGAGAAATAAAAGAAGAAGCTTT 

LysHiaPheAspProArgLeuLeuIleAlaLeuG lyLysTy rll eTy rThr ArgH isG ly 

MetGlu 

AAAGCATTTTGACCCTCGCTTGCTAATTGCTCTTGGCAAATATATCTATACTAGACATGG 

. . . 5800 . : 

AspThrLeuGluGlyAlaArgGluLeuIleLysValLeuGlnArgAlaLeuPheThrHia 

ThrProLeuLysAlaProGluSerSerLeuLyaSerCysAsnGluProPheSerArgThr 

agacacccttgaaggccccagagagctcattaaagtcctgcaacgagcccttttcacgca 

PheArgAlaGlyCyaGlyHisSerArglleGlyGlnThrArgGlyGlyAanProLeuSer 
SerGluGinAspValAlaThrGlnGluLeuAlaArgGlnGlyGluGluIleLeuSerGlu 
CTTCAGAGCAGGATGTGGCCACTCAAGAATTGGCCACACAAGGGGAGGAAATCCTCTCTC 

5900 . 

AlalleProThrProArgAanMetGln 
LeuTyrArgProLeuGluThrCysAsnAsnSerCysTyrCysLysArgCysCysTyruia 

AGCTATACCGACCCCTAGAAACATGCAATAACTCATGCTATTGTAAGCGATGCTGCTACC 

6000 

MetAsnGluArgAlaAap 
CysGlnMetCysPheLeuAsnLysGlyLeuGlylleCyaTyrCluArgLyaGlyArgArg 
ATTGTCAGATGTGCTTTCTAAACAAGGGGCTCGGGATATGTTATGAACGAAAGGGCAGAC 

GluGluGlyLeuGlnArgLysLeuArgLeuIleArgLeuLeuHisGlnThrSerCluTyr 

Met 

ArgArgThrProLyaLysThrLyaThrHisProSerProThrProAspLys 
GAAGAAGGACTCGAAAGAAAACTAAGACTCATCCGTCTCCTACACCAGACAAGTGAGTAT 

6100 

AspGluSerAlaAlaTyrCysHisPhelleSer 
MetAsnGlnLeuLeulleAlalleLeuLeuAlaSerAlaCysLeuValTyrCyaTnrGln 

GATGAATCAGCTGCTTATTGCCATTTTATTAGCTAGTGCTTGCTTAG.TATATTGCACCCA 

• • • ' • 

TyrValThrValPheTyrGlyValP.roThrTr.pLy a AanAlaThrlleProLeuPheCys 

ATATGTAACTGTTTTCTATGGCGTACCCACGTGGAAAAATGCAACCATTCCCCTCTTTTG 

6200 ' * * ; , * 

AlaThrArgAsnArgAapThrTrpGlyThrlleGlnCysLeuProAspAsnAapAspTyr 

TGCAACCAGAAATAGGGATACTTGGGGAACCATACAGTGCTTGCCTGACAATGATGATTA 

. |# 6300 

GlnGluIleThrLeuAsnValThrGluAlaPheAspAlaTrpAsaAsnThrValThrGlu 

TCAGGAAATAACTTTGAATGTAACAGAGGCTTTTGATGCATGGAATAATACAGTAACAGA 

GlnAlalleGluAapValTrpHisLeuPheGluThrSerlleLysProCysValLyaLeu 
ACAAGCAATAGAAGATGTCTGGCATCTATTCGAGACATCAATAAAACCATGTGTCAAACT 

•(fig.lA-suiTte 5) 6 *°° . 
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ThrProLeuCya Va lAlaMetLysCy a Ser Ser XbrG lu Ser SerXbrG lyAaaAsnXbr 
AACACC TTTAXGTGXAGCAAXGAAAXGCAGCAGCACAGAGAGCAGCACAGGGAACAACAC 

TbrSerLysSerTbrSerTbrXbrTbrXbrXbrProXbrAspGlnGluGlnGluIleSer 

AACCTCAAAGAGCACAAGCACAAC CACAACCACACCCACAGACCAGGAGCAAGAGATAAG 

6500 • • 

GluAepTbrProCysAlaArgAlaAspAsaCysSerGlyLeuGlyGluGiuGluXhrlle 

TGAGGATACTCCATGCGCACGCGCAGACAACXGCTCAGGATTGGGAGAGGAAGAAACGAX 

6600 

As nCy a G laPheAanMe t TfarGly LeuG luArg As pLy a Ly a Ly 3 GluXyrAsaGluXbr 
CAATTGCCAGTTCAATATGACAGGATTAGAAAGAGATAAGAAAAAACAGTATAATGAAAC 

• • • • • • 

XrpXyrSerLysAapVa IVa ICy aG luXhr AaaAaaSer Xbr AsnG laXhrGlaCy sXyr 
ATGGTACTCAAAAGATGTGGTTTGTGAGACAAATAATAGCACAAATCAGACCCAGTGTTA 

6700 

MetAsnHisCysAsnTbrSerVallleTbrGluSerCysAspLysHisTyrTrpAspAla 
CATGAACCATTGCAACACATCAGTCATCACAGAATCATGTGACAAGCACTATTGGGATGC 

I leArgPbeArgXyrCyaAlaProProG lyTy rAlaLeuLeuArgCy sAsnAspThrAsn 
TAXAAGGTXXAGAXACXGXGCACCACCGGGXXAXGCCCTAXXAAGAXGXAAXGAXACCAA 

6800 ♦ 

TyrSerGlyPheAlaProAsnCysSerLysValValAlaSerThrCysThrArgMetMet 
TTATTCAGGCTTTGCACCGAACTGTTCTAAAGTAGTAGCTTCTACATGCACCAGGATGAT 

.6900 

G luThrGlnThr Se rXhr XrpPbeG lyPheAs nG lyXbrArgAlaG luAsaArgXbrty r 
GGAAACGCAAACTTCCACATGGTTTGGCTTTAATGGCACTAGAGCAGAGAATAGAACATA 

• • • * 

IleXyrXrpHisG lyArgAepAsnArgThr I lei 1 eSer LeuAsnLy 8 TyrTyr AsnLeu 
TATCTATTGGCATGGCAGAGATAATAGAACTATCATCAGCTTAAACAAATATTATAATCT 

7000 

SerLeuHiaCysLysArgProGlyAsnLysThrValLysGlnlleMetLeuMetSerGly 
CAGXXTGCAXXGXAAGAGGCCAGGGAATAAGACAGXGAAACAAAXAATGCXXAXGXCAGG 

HiaValPbeHisSerHiaTyrGlnProIleAsnLyaArgProArgGlaAlaXrpCyaXrp 
ACATGTGTTTCACTCCCACTACCAGCCGATCAATAAAAGACCCAGAGAAGCATGGTGCTG 

7100 . 

PbeLysGlyLysTrpLyaAspAlaMetGlnGluValLysGluTbrLeuAlaLysHisPro 
GTXCAAAGGCAAAXGGAAAGACGGCAXGCAGGAGGTGAAGGAAACCCXXGCAAAACAXCC 

7200 

ArgXyrArgGlyXbrAaaAapXbrArgAaalleSerPbeAlaAlaProGlyLysGiySer 
CAGGXAXAGAGGAACCAAXGACACAAGGAAXAXXAGCXXXGCAGCGCCAGGAAAAGGCXC 

t . . • • 

AapProGluValAlaXyrMetXrpXbrAsaCyaArgGlyGluPheLeuXyrCysAsnMet 

AGACCCAGAAGXAGCAXACAXGXGGACXAACXGCAGAGGAGAGXTXCXCXACXGCAACAX 

7300 

TbrTrpPbeLeuAsnTrpIleGluAanLysTbrHisArgAanTyrAlaProCysHisIle 
GACTTGGTTCCTCAATTGGATAGAGAATAAGACACACCGCAAXTATGCACCGTGCCATAT 

LysGlallelleAsaXbrTrpHisLysValGlyArgAanValXyrLeuProProArgGlu 
AAAGCAAAXAAXXAACACAXGGCAXAAGGXAGGGAGAAAXGXAXAXXXGCCXCCC AGGGA 

. 7400 • • • 

GlyGluLeuSerCyeAsaSerXbrValXbrSerllelleAlaAsnlleAapXrpGlaAaa 

AGGGGAGCTGXCCXGCAACTCAACAGXAACCAGCATAAXXGCXAACAXTGACTGGCAAAA 

7500 

AsnAauGlaXbrAaalleXbrPbeSerAlaGluValAlaGluLeuTyrArgLeuG luLeu 
CAAXAAXCAGACAAACAXXACCXXXAGXGCAGAGGXGGCAGAACXAXACAGAXXGGAGXX 

GlyAspXyrLyaLeuValGluIleXhrProIleGlyPbeAIaProTbrLysGluLysArg 
GGGAGAXXAXAAAXXGGXAGAAAXAACACCAAXXGGCXXCGCACCTACAAAAGAAAAAAG 
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TyrSerSerAlaHisClyArgHisThrArgGlyValPheValLeuGlyPheLeuGlyPhe 
ATACTCCTCTGCTCACGGGAGACATACAAGACGTGTGTTCCTCCTACGGTTCTTGGGTTT 

..•*** 

LeuAlaThrAlaOlySerAiaMetGlyAUAlaSerLeuThrValSerAlaGlnSerArg 

TCTCGCAACAGCAGGTTCTGCAATGGGCGCGGCGTCCCTGACCGTGTCGGCTCAGTCCCG 

7700 • 
ThrLeuLeuAlaGlylleValGUGlnGlnGlnGlnLeuLeuAepValValLyaArgGln 

GACTTTACTGGCCGGGATAGTGCAGCAACAGCAACAGCTGTTGCACGTGGTCAAGAGACA 

• • * /OUU 

GlaGluLeuLeuArgLeuTbrValTrpGlyTbrLyaAanLeuGlnAlaArgValThrAla 
ACAAGAACTGTTGCGACTGACCGTCTGGGGAACGAAAAACCTCCAGGCAAGAGTCACTGC 

• 

IleGluLysTyrLeuGlnAspGlnAlaArgLeuAanSerTrpGlyCysAlaPheArgGln 
TATAGAGAAGTACCTACAGGACCAGGCGCGGCTAAATTCATGGGGAXGTGCGTTTAGACA 

. . 7900 

ValCysHisTbrThrValProTrpValAanAspSerLeuAlaProAspTrpAspAsnHet 
AGTCTGCCACACTACTGTACCATGGGTTAATGATTCCTTAGCACCTGACTGGGACAATAT 

. 

ThrTrpGlnGluTrpGLuLyaGlnValArgTyrLeuGluAlaAsnlleSerLysSerLeu 
GACGTGCCAGGAATGGGAAAAACAAGTCCGCTACCTGGAGGCAAATATCAGTAAAAGTTT 

8000 . 

GluGinAlaGinlieGlnGlnGluLyaAsnMetTyrGluLeuGlnLysLeuAenSerTrp 
AGAACACGCACAAATTCACCAAGAGAAAAATATGTATGAACTACAAAAATTAAATAGCTG 

• 8100 

AspIlePbeGlyAsnTrpPheAspLeuThrSerTrpValLysTyrlleGlnTyrGlyVal 
GGATATTTTTGGCAATTGGTTTGACTTAACCTCCTGGGTCAAGTATATTCAATATGGAGT 

LeuItelleValAlaVallleAlaLeuArglleVallleTyrValValGlnMetLeuSeg 

•7*1 

GCTTATAATAGTAGCAGTAATAGCTTTAAGAATAGTGATATATGTAGTACAAATGTTAAG 

8200 

AlaCy sPtaeLeuPbeProProArgLeuTyrProThrAsp 
ArgLeuArgLysGlyTyrArgProValPbeSerSerProProGlyTyrlleGlnGlnlle 
GlyLeuGluArgAlalleGlyLeuPheSerLeuProProProVallleSerAsnArgSer 
TAGGCTTAGAAAGGGCTATAGGCCTGTTTTCTCTTCCCCCCCCGGTTATATCCAACAGAT 

ProTyrProGlnGlyProGlyThrAlaSerClnArgArgAsnArgArgArgArgTrpLys 
HialleHiaLyaAapArgGlyClBProAlaAaaCluCluThrGluGluAapGlyGlySer 
IleSerTbrArgThrGlyAspSerGlnProThrLyaLyaGlnLysLyaThrValGluAla 
CCATATCCACAAGGACCGGGGACAGCCAGCCAACGAAGAAACAGAAGAAGACGGTGGAAG 

8300 . 

GlnArgTrpArgGlnllaLeuAlaLeuAlaAspSerlleTyrTbrPbeProAapProPro 
AsnGlyGlyAspArgTyrTrpProTrpProIleAlaTyrlleHiaPheLeuIleArgGla 

ThrValGluTbrAapTbrGlyProGlyArg 
CAACGGTGGAGACAGATACTGGCCCTGGCCGATAGCATATATACATTTCCTGATCCGCCA 

1 



8400 



• • • 

AlaABpSerFroLeuAspGlnTbrlleGlnHisLeuGlnGlyLeuThrlleGlaGluLeu 

LeuIleArgLeuLeuTbrArgLeuTyrSerlleCysArgAspLeuLeuSerArgSerPhe 
G C TGATT CGC C TC XXGA C C AGA CXAXACAGCAXCTGC AG GG AC XXACX AX CCAGGAGC XX 

ProAspProProXhrHisLeuProGluSerGlnArgLeuAlaG luXhr 

LeuThrLeuGlnLeuIleTyrGlnAsnLeuArgAspTrpLeuArgLeuArgThrAlaPhe 
CCXGACCCXCCAACXCAXCXACCAGAAXCXCAGAGACTGGCTGAGACXXAGAACAGCCXX 

8500 

LeuGlnXyrGiyCysGluXrpIleGlnGluAlaPheGlnAlaAlaAlaArgAlaXhrArg 
MetGlyAlaSerGlySerLysLysHigSerArgProProArgGlyLcuGlnGla 
CXXGCAAXAXGGGXGCGAGXGGAXCCAAGAAGCAXXCCAGGCCGCCGCGAGGGCTACAAG 
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GluThrLeuAlaGlvAlaCysArgGlyLeuTrpArgValLeuGluArgUeGlyArgGly 

ArgLeuLeuArgAlaArgAlaGlyAlaCysGlyGlyTyrTrpAsnGluSerGlyGlyGlu 
AGAGACTCTTGCGGGCGCGTGCAGGGGCTTGTGGAGGGTATTGGAACGAATCGGGAGGGG 

8600 . 
IleLeuAlaValProArgArglleArgGlnGlyAlaCluIleAlaLeuLeu 

TyrSerArgPheGlnGluGlySerAspArgGluGlnLyaSerProSerCyaGluGlyArg 

AATACTCGCGGTTCCAAGAAGGAICAGACAGGGAGCAGAAATCGCCCTCCTGTGAGCGAC 

GlaTyrGlnGloGlyAspPheHetAanThrProTrpLyaAspProAlaAlaGluArgGlu 
GGCAGTATCAGCAGGGAGACTTTATGAATACTCCATGGAAGGACCCAGCAGCAGAAAGGG 

LysAanLeuTyrArgGlnGlnAanMetAspAspValAspSerAapAapAspAapGlnVai 
AGAAAAATTTGTACAGGCAACAAAATATGGATGATGTAGATTCAGATGATGATGACCAAG 

8800 ■ - 

ArgValSerValThrProLysValProLeuArgProMetThrHisArgLeuAlalleAsp 
TAAGAGTTTCTGTCACACCAAAAGTACCACTAAGACCAATGACACATAGATTGGCAATAG 

MetSerHisLeuIleLysThrArgGlyGlyLeuGluGlyMetPheTyrSerGluArgArg 
ATATGTCACATTTAATAAAAACAAGGGGGGGACTGGAAGGGATGTTTTACAGTCAAAGAA 

8900 • • * 1 

HisLysIleLeuAsnlleTyrLeuGluLysGluGluGlylialleAlaAspTrpGlnAan 

GACATAAAATCTTAAATATATACTTAGAAAAGGAAGAAGGGATAATTGCAGATTGGCAGA 

TyrThrHiaGlyProGlyValArgTyrProHeCPhePheGlyTrpLeurrpLysLeuVal 
ACTACACTCATGGGCCAGGAGTAAGATACCCAATGTTCTTTGGGTGGCTATGGAAGCTAG 

ProValAspValProGlaGluGlyGluAapThrGluThrHiaCyaLeuValHiaProAls 
TACCAGTAGATGTCCCACAAGAAGGGGAGGACACTGAGACTGACTGCTTAGTA CATCCAG 

9100 

GlnThrSerLysPheAapAepProHisGlyGluThrLeuValTrpGluPbeAspProLeu 
CACAAACAAGCAAGTTTGATGACCCGCATGGGGAGACACTAGTCTGGGAGTTTGATCCCT 

. . . • • 

LeuAlaTyrSerTyrGluAlaPhelleArgTyrProGluGluPheGlyHisLyaSerGly 

TGCTGGCTTATAGTTACGAGGCTTTTATTCGGTACCCAGAGGAATTTGGGCACAAGTCAG 

9200 . 
LeuProG luGluG luTrpLya AlaArgLeuLya AlaArgG ly I leProPheSer 
GCCTGCCAGAGGAAGAGTGGAAGGCGAGACTGAAAGCAAGAGGAATACCATTTAGTTAAA 

. • • • • SJOU 

GACAGGAACAGCTATACTTGGTCAGGGCAGGAAGTAACTAACAGAAACAGCTGAGACTGC 

AGGGACTTTCCAGAAGGGGCTGTAACCAAGGGAGGGACATGGGAGGAGCTGGTGGGGAAC 

9400 

GCCCTCATATTCTCTGTATAAATATACCCGCTAGCTTGCATTGTACTTCGGTCGCTCTGC 

GGAGAGGCTGGCAGATTGAGGCCTGGGAGGTTCTCTCCAGCAGTAGCACGTAGAGCCTGG 

... . - . _ . _ _.95Q0. - — .... - - « — — - — - - — » - * ~~ * * * 

GTCTTCCCTGCTAGACTCTCACCAGCACTTGGCCGGTGCTGGGCAGACGGCCCCACGCTT 

. • • ' 9600 

GCTTGCTTAAAAACCTCCTTAATAAAGCTGCCAGTTAGAAGCA 
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FIG IB 



AGTCGCTCTGCGGAG AGGCTCCC AGATTGAGCCCTfcGGAGGTTCTCTCC AGC ACT AGC AG 

• ••••• 

GT AG AGCC TGGGTGTTCCCTGCT AGACTCTC ACC AGCACTTGGCCGGTGCTGGGCAG ACT 

100 

CGCTCCACGCTTCCTTCCTTAAACACCTCTTCAATAAACCTCCCATTTACAAGTAAGCTA 

GTGTGTGTTCCCATCTCTCCTAGTCGCCGCCTGGTCAACTCGGTACTCCGTAATAAAAAG 

• 200 • • • 

ACCCTGGTCTGTTACGACCC TGGTCTGTTAGG ACCCTTTCTGCTTTGGGAAACCG A AGCA 

300 

GGAA AATCCCT AGC AGAT TGGCGCCCG AACAGGG ACTTGAAGGAGAGTGAGAG ACTCCTG 

AGTACGGCTGAGTGA ACGCAGT A AGGGCGGC AGGAACC A ACC ACGACGGAGTGCTCCT AG 

• - • • *00 • • 

AA AGGCGCGGGTCGGT ACC AGACGGCGTGAGG AGCGGGGAGAGAAGAGGCCTCCTGGTTG 

• ••••• 
CAGGTAAGTGC AAC AC A AAAAGG AAATAGCTGTCTTTT ATCC AGGAAGGGAT AAT AAGAT 

• 500 • • • • 

GAGDMETGLY AL AARG ASNSER YALLEUSERGLYLYSL YS AL AASPGLULEUGLU 
AC AGTCGGAGATCCCCGCG AGAA ACTCCGTCTTGTCAGGGAAG AAAGC AGATGAATTAGA 

600 

LYS ILEARGLEU ARGPR OGLYGLYL YSL YSL YST YRrtETLEUL YSHI S VAL VALTRP ALA 
AAAA ATT AGACT ACG ACCCGGCGGAAAG AAA A AGTACATGTTG AAGCATGTAGTATGGGC 

ALAASNGLULEUASP Aft GPHEGL YLEUALAGLUSERLEULEUGLUASNLYSGLUGL YCYS 
AGCA AATGAATT AGATAGATTTGGATT AGCAGAA AGCCTGTTGGAG AACAAAGAAGGATG 
. • • 70.0 • • 

GLNLY 5 1 LELEU5ERVALLEU ALAPROLEUV ALPRQTHRGLXSERGLUASNLEULYSSER 
TCAAAA AATACTTTCGGTCTTAGCTCC ATTAGTGCC AACAGGCTCAGAAAATTTAAAAAG 

LEUTYRASNTHRV ALCYSV AL ILETRPCYS ILEHI SAL AGLUCLULYSVALL YSHl STHR 
CCTTTATAATACTGTCTGCGTC ATCTGGTGC ATTCACGC AGAAGAG AAAGTG AAAC ACAC 
« 800 « • • • 

CLUGLUALALY5GLNILEVALGLNARGH ISLEUVALflETGLtfTHRGL YTHRALAGLUTHR 

TG AGGAAGC A AAACAGAT AGTGCAGAGACACCT AGTG ATGGA AACAGCAACAGCAGAAAC 

900 

MET PROLYSTHRSERAR GPRGTHRALAPROPHE 5ERGLYARGGLYGL YASNTYRPROYAL 
TATGCCAAAAACAACTAC ACC AACAGCACC ATTT AGCGGC AG AGGAGG AAATTACCCAGT 

• ••••• 

GLNGLNI LEGLYGLYA5NTYRTHRH I5LEUPR0LEUSERPR0ARGTHRLEUA5NALATRP 

ACAACAAATAGGTGGTAACT AT ACCC ACCT ACC ATTAAGCCCGAGAAC ATTAAATGCCTG 

• • • 1000 • • 
VALLYSLEU ILEGLUGLULYSLYSP HE GLYALAGLU VALVAL SERGLYPHEGLNALALEU 

GGTA AAATTAATAGAGGAGAAGAAATTTGCAGCAGAAGTAGTGTCAGCATTTCAGGCACT 

SERGLUGLYCYSLEUPROTYRASPILEASNGLNrtETLEUASNCYSVALGLYASPHISGLN 
GTCAGAAGGCTGCCTCCCCTATGACATTAATC AGATGTTAAATTGTGTGGGAGACC ATCA 

• 1100 • • • « 
ALA ALA ME TGL NILE ILEARGASPILE ILEASNGLUGLUAL AALAASPTRP ASPLEUGLN 

AGCGGC T ATGCAGATCATCAGAG ATATTATA AATGAGGAGGCTGCAGATTGGGACTTGCA 

1200 

HIS PROGLNGLNALAPROGLNGLNGLYGLNLEUARGGLUPROSERGLYSER ASP ILE ALA 
GCACCC ACAACAAGCTCC ACAACAAGGACAGCTTAGGGAGCCGTCAGGATCAGATATTGC 

CLYTHRTHRSERTHRVALGLUGLUGLN ILECLNTRPHETTYRARGCLNGLNASNPRO ILE 
AGGAACAACTAGTACACTAGAAGAACAAATCCAGTGGATGTACAGACA ACAGAACCCCAT 

1300 
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PROVALGLYASNILETYRARGARGTRPILECLNLEUGLYLEUCLNLYSCYSVALARCMET 
ACCAGTAGGCAACATTTACAGGACATGCATCC A AC T GG GG T T GC A AAA ATGT CTC AG A AT 
• • « • • 

TYRASNPROTHRASNILELEUASPVALLYSCLNGLYPROLYSGLUPROPHEGLNSERTYR 

GTATAACCCAACAAACATTCTAGATGTAAAACAAGGGCC AAAAGAGCC ATTTCAGAGCTA 

1400 . • • • 

VAL AS PARG P HE TYRLYSSERLEUARGALAGLUGLNTH RASP PRO AL AY ALL YSASNTRP 

TGTAGACAGGTTCTACAAAAGTTTAAGAGCAGAACAAACAGATCCAGCAGTAAAGAATTC 

1500 

ME T THRGLNTHRLEULEU ILE GLNA SNALAASNPRO ASPC YSL YSLEUVALLEULY5GL Y 
GATGACTCAAACACTGCTGATTCAAAATGCT AACCC AG ATTGCAAGCT AGTGCJGAAGGG 

LEUGLYTHRASNPROTHRLEUGLUGLUMETLEUTHRAL AC YS GLNGLYVAL GLYGLYPRO 
GCTGGCTACGAATCCCACCCTACAAGAAATGCTGACGGCCTGTCAAGGAGTAGGGGCGCC 

1600 

GLY GLNL YS ALAARGL EUMET ALAGLU ALALEUL YSGLUALALEUALAPRO ALAPROI LE 
AGGACAGA AGGCT AG ATT AATGGCAG AAG CCCTG A AAGAGCCCCTCGC ACC AGCGCC AAT 

POLVALLEUGLULEUTRP 
PROPHEAL AALAALAGLNGLNLYS GLYPRO ARGL YSPRO ILEL YSCYSTRP ASNCYSGLY 
CCCT TTTGCAGC AGCCC AAC AG AAGGG ACCA AGA AAGCC AATTAAGTGTTGC AATTGTGG 

1700 • • • • 

GLUGLY ARGTHRLEUCYSLYSALAMETGLNSERPROLYSLYSTHRGL YMETLEUGLUrtET 

LYSGLUGLYH I S SERALAARGGLNCY5 ARC ALAP ROAR GAR GGLNGLYCYSTRPLYSCYS 
C AAGGA AGGACACTCTGC AAGGCAATGC AGAGCCCC AAGA AG AC AGOG ATGC TGGAAATG 

1800 

TRPL YS ASNGLYPRQCYSTYRGLYGLNMETP ROL YSCLNTHRGLYGLYPHEPHE ARGPRO 

GLY LYSrtETAS PH IS VALMET ALAL YSCYS PROA SNA RGGLN ALA GLYPHELEUGL YLEU 
TGGA AAAATGGACC ATGTTATGGCC AAATGCCC A AACAGACAGGCGGGTTTT TTAGGCCT 

TRP PROLE UGLYLYSGLUAL APROGLNP HE PROH IS GL YSERSERALA SERCLYAL AASP 

GLY PROTRPGLYLYSLY SPROARGASNPHE PRQHETALAGLNVALHISGLNCLYLEUTHR 
TGGCCCTTGCGGAAAGAAGCCCCGCA ATTTCCCC ATGGCTC'AAGTGCATC AGGGGCTGAC 

1900 

ALAASNCYS SERPR0ARGARGTHR5ERCYSGLYSERALALYSGLULEUHI SAL ALE UGLY 

PROTHRALA PROPROGL UGLUPROAL AV AL ASPLEULE ULYSA5NTYRMETHI SLEUGLY 
GCC AACTGCTCC CCCAGAAG AACC AGCTGTGGATCTGCT AAAGAACT ACATGCACTTGGC 

• • • • • • 
CLNALAALACLUARGLYS GLNARGGLUAL ALEUGLNGLYGLY ASPARGGLYPHEALAALA 

LYSGLNGLNARGGLUSERARGGLYLYSPROTYRLYSGLUVALTHRGLUASPLEULEUHIS 
C AAGCAGC AGAGAGAAAGCAGAGGGAAGCCTTACAAGG AGGTGACACAGGATTTGCTGCA 

• 2000 • • • • 
PROGLNPHESERLEUTRP ARGARG PROVALYALTHRAL AHI 5 ILEGLUGLYGLNPRCYAL 

LEUASNSERLEUPHEGLYGLYASPGLN* 
CCTCAATTCTCTCTTTGGAGCAGACCAGTAGTCACTGCTCATATTGAAGGAC AGCCTGTA 

2100 

GLUV ALLEULEUASPTHRGLYALAASPASP5ERILEYALTHRGLYILE GLULEUGLYPRO 
G AAGTATTATTAGATACAGGGGCTGATGATTCTATTGT AACAGCAATAGAGTTAGGTCCA 

• ••••• 

HI STYRTHRPROLYS ILE VALGLYGLYILEGLYGLYPHE ILE ASNTHRLYSCLUTYRLYS 
CATT AT ACCCC AAAAATAGT ACGAGGAATAGGAGGTTTTATTAATACT AAAG AAT ACAAA 

2200 

ASNVALGLUILEGLUVALLEUGLYL YSARGI LEL YSGL YTHRILEMETTHRGLY ASPTHR 
AATGTAG AAATAGAAGTTTTAGGC A AAAGGATTAAAGGGACA ATCATG AC AGGGGACACC 

PRO ILE AS N I LEP HE GLYAR CA SNLEULEUTHRALALE UCLYME TSERLEUA SNLEUPRO 
CCG ATTAACATTTTTGGTAGAAATTT ACT AACAGCTCTGGGGATGTCTCTAAATCTTCCC 
2300 • 

ILEALAL YS VALCLUPROVALLYS SE RPROLEUL YSPR0GLYLYSA5PGLYPR0LY5LEU 
ATAGCTAAGGTAGAGCCTGTAAAGTCGCCCTTAAAGCC AGGAAAGGATGGACCAAAATTG 

• . . 2400 

LYSGLNTRP PR0LEUSERLY5GLULY5 ILEVALAfcALEUARGGLUILECYSGLULYSMET 
AAGCAGTGGCCATTATCAAAAGAAAAGATAGTTGCATTAAGAGAAATCTGTGAAAACATC 

(fig. IB-suite 1) 
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GL UL YS AS PGL YGL NLEUGL UGLUAL APROPROTHR ASNPROT YRASNTHRPROTHRPHE 
GAAAAAGATGGTCAGTTGCAGGAACCTCCCCCGACCAATCCATATAACACCCCCACATTT 

2500 

ALAILELYSLYSLYSASPLYSASNLYSTRPARGMETLEUILEASPPHEARGGLULEUASN 
GCTATAAAGAAAAAGGAT AA AA AC A A A TGGAG A A T GC T G AT AG A TTTT AGGG A ACT AA AT 

ARGVALTHRGLNASPPHETHRGLUVALGLNLEUGLYILEPROHI SPROAL ACL YLEUALA 
AGGGTCACTCAAGACTTTACGGAAGTCCAATTAGGAATACCACACCCTGCAGGACTACCA 

2600 . 

LYSARCLYSARCILETHRVALLEUASPILEGLYASPALATYRPHESERILEPROLEUASP 
AAAAGGAAAAGGATTACAGTACTGGATATAGGTGACGCATATTTCTCTATACCTCTAGAT 

2700 

G'LUGLUPHEARGGLN TYRTHRALAPHETHRLEUPR05E RVALASNASNALAGLUPROGLY 
G A AGAATTT AGGCAGTAC ACTGCCTT T ACTTT ACC ATC AGTAAAT AATGC AG AGCC AGGA 

.•••«• 
LYSARGTYRILETYRLYS YALLEUPROGLNGLYTRPL YSGLY5E RPROAL A I LEPHEGLN 
A AACGATAC ATTTAT AAGGTTCTGCCTC ACGC ATCGAAGGGGTC ACC AGCC ATCTTCC A A 

. . .28 00 

TYRTHRHET ARGHIS VALLEUGLUPROPHEARGLYSALAASNPROASP VALTHRLEUVAL 
TACACT ATG AGAC ATGTGCT AG AACCCTTC AGGAAGGCA AATCC AGATGTGACCTTAGTC 

GLNTYRHETASPASP ILELEUI LE AL A SE R A S P ARGTHRASPLEUGLUHI S A S P ARC VAL 
CAGT AT ATGGATGACATCTT AAT AGCT AGTG AC AG G AC AG A CCTGG A AC ATG AC AG GOT A 

2900 '• 
VALLEUGLNLEULYSGLULEULEUASNSERILEGLYPHE SERSERPROGLUGLULYSPHE 
GTTTTACAGTTAAAAGAACTCTTAAATAGCATAGCGTTTTCATCCCCAGAAGAGAAATTC 

• • • • • 300O 
GLNL YS ASP PRO PROP HE GL NT RP HETGLYTYRGLULEUTRPPROTHRL YSTRPLYSLEU 
CA AAAAGATCCCCCATTTCA ATGGATGGGGT ACGAATTGTGGCCGACAAAATCGAAGTTG 

GLNL YS ILEGLULEUPROGLNARGGLUTHRTRPTHRVALAS NASP ILE GLNL YSLEUVAL 
CAAAACATACAGTTGCCACAAAGAGAGACCTCGACAGTGAATGATATACAGAAGTTAGTA 

. 3100 

GLYVALLEUASNTRP ALA ALAGLNILETYRPROGLY ILELYSTH RLYSHI SL EUCYSARG 
GGAGTATTAAATTGGGCAGCTCA AATTTATCC AGGTAT AAAAACCAAACATCTCTGTAGG 

. . • • ... 

LEUILEARGGLYLYSHETTHRLEUTHRGLUGLUVALGLNTRPTHRGLUNETALAGLUALA 
TTAATTAGAGGAAAAATG ACTCT AAC AC AGGA ACT TC AGTG GACTG AG ATGG CAGAAGCA 

• 3200 . • • 
GLUTYRGLUGLUASNLYSILEILELEU5ERGLNGLUGLNGLUGLYCY5TYRTYRCLNCLU 

GAAT ATGAGG AAAAT AAAAT AATTCT CAGTC AGGAAC A AGAAGGATGTTATT ACCAACAA 

3300 

SERL YS PROLEUGLUALATHRV AL ILELYSSERGLNASPASNGLNTRPSERT YRLYSILE 
AGCAACCCATTAGAAGCCACGGTGATAAACAGTCAGGACAATCAGTGGTCTTATAAAATT 

HISGLNCLUASPLYSILELEULYSVALGLYLYSPHEALALYSILELYSASNTHRHISTHR 
CACCAAGAAGACAAAATACTGAAAGTAGCAAAATTTGCAAAGATAAACAATACACATACC 

. . 3400 

ASNGLY VALARGLEULEUALAHISVALILEGLNLYSILEGLYLYSGLUALAILEVALILE 
AATGGAGTTAGACTATTAGCACATGTAATACAGAAAATAGGAAAGGAAGCAATAGTGATC 

• ••••• 

TRPGLYGLNVALPROLYS PHEH ISLEUPROVALGLULYSASPVALTRPCLUGLNTRPTRP 
TCGGGACAGGTCCC AAAATTCC ACTT ACCAGTTGAGAAGGATGT ATGGGAAC AGTGGTGG. 

3500 • » 

THRA SPTYRTRPGLNVALTHRTRP ILE PROGLUTRP ASPPH6 ILESERTHRPROPROLEU 
ACAG ACT ATTGGCAGGTA ACCTGGAT ACCGG AATGGGATTTCATCTCA ACACCACC AJTA 

...» 3 600 
VALARGLEUVALPHEASNLEUVALLYS ASP P ROIL EGLUGLYGLUGLUTHRTYRTYR VAL 

CTAACATTAGTCTTCAAT CTAGTCAAGGACCCTATAGAGCGAGAAGAAACCT ATTATGTA 

• ••••• 
ASPGLYSERCYS SERLYSGLNSERLYSGLUGLYLYSALAGLYTYRILETHRASPARGGLY 
GATGGATCATGTAGTAAACAGTCAAAAGAAGCAAAAGCACGATATATCACAGACAGGGGC 

(fig. IB-suite 2 ) 
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3700 • • 

LYSA5PLY5 VALL YSVALLE UCLUGLNTHRTHR A S NG L NCLN AL ACLUL E UGLUALAPHE 
AAAGACAAGGT AAAAGTGTT AG A AC AG ACT ACT A A TC A ACAAGC AG AA TT GG AA GC A T T T 

• m m • • • 

LEUMETALALEUTHRASPSERCLYPRQLYSALAASNILE 1LEYALASP SE RGLNT YR VAL 
CTCATGGCATTGACAGACTC AGGGCC A AAGGC A AA T A T T AT AG T AC AC TC AC AAT A TC T T 
3800 « • • • 

METGLYILEILETHRGLYCYSPR0THRGLUSERCLU5ERARGLEUVALA5NGLNILEILE 

* ATGGGAATAATAACAGGATGCCCT AC AG AATC AGACAGC AGGCT AGTT AACC AAATAATA 

3<?00 

GLUGLUMET ILEL YSL YSTHRGLUILET YRVALALATRP VALPR OALAHI SL YSGL Y ILE 
s GAAG AAATGATCA AA AAG AC AGAAATTT ATGTGGCATGCGTACC AGCACACA AAGGTATA 

« « • • • « 

GLYGL YASNGLNGLU ILE AS PH I SLEUV ALSERGLNGLY ILEARGGLN VALL EUPHELEU 
GGAGGAAACCAAGAAATAGACCACCTAGTTAGTCAAGGGATTAGACAAGTTCTCTTCTTG 
. • • 4000 • # 

GLULYS ILEGLU PROALAGLNGLUCLUH I5SERLYSTYPHISSERA5NILELYSGLULEU 
GAAAAGATAGAGCCAGCACA AGAAG AAC AT AGT A AATACC AT AGTAAC AT AAAACAATTG 

• • * • • • 
VALPHEL YSP HE GLYLE UPROAR GL EUV ALALAL YSGL N I LE V ALA SPTHRC YSASPLY5 
GT ATTCA AATTT GGATTACCCAGACT AG TGGC CAAAC ACATAGTAGACAC ATGTGATAAA 

« 4100 • « • • 

CYSH I S GLNL YSGL YGLUAL A ILEH I SGLYGLNV ALAS NSE R A5PL EUGL YTHRTRPGLN 
TGTC ATCAAAAAGGAGAAGCTATACATGGGC AGGTAAATTCAGACCTA£GGACTTGGCAA 

4200 

METASPCYSTHRHI SLEUGLUGLYLYS I LEVAL ILE YALALA VALHISVALALASERCLY 
ATGGATTGTACCCATCTAGAGGGAAAAATAGTCATAGT TGC AGTAC ATGTAGCT AGTGGA 

• « • • • * 
PHC ILEGLUALAGLUVAL ILEPROGLNGLUTHRGLYAR GGLN THRALALE UPHELEULEU 
TT CAT AG AAGCACAAGTAATTCCACA AG AAACAGGA AG AC AGAC AGCACTATTTCTCTTA 

« « • 4300 • • 

LYSLEUALASERARGTRP PRO I LETHRHI SLE UHI STHRASP ASNGLYALAASNPHE ALA 
A AATTGCCA ACCAG ATGGCCTATTAC AC ATCTGC ACACAG AT AATGCTGCTAACTTTGCT 

• «•«•• 
SE RGLNGLUVALLYSJ1ET YALALATRPTRPALAGLYILEGLUHI STHRPHEGLYYALPRO 
TCGCAAGAAGT AAAGATG GTTGCATGGTGGGC AGGG ATAGAGCACACCTTTGCGGTACC A 

• 4400 • • • • 
TYRASNPROGLNSERGLNGLYYALYALGLUALAME TASNHI SHI SLEULYSASNGLN ILE 
T ACA ATCCACAGAGTC AGGG AGTAGTGGAAGC A ATG AATC ACCACCTG AA AAATCAAATA 

4500 

AS PARC ILEARGGLUCLN ALAASNSERVALGLUTHRI LE VALLEUMET ALAVALHI SCYS 
GATAGAATCAGCGAACAAGCAAATTCAGTAG AAACCATAGTATTAATGGCAGTTCATTCC 

«ETASNPHELY3ARGARGGLYGLYILEGLYASPf1ETTHRPR0ALACLUARGLEUILEASN 
ATG A ATTTTA AAAG A AGGGG AG G AAT ACG GG AT AT GACTCCAGC AG AA AG AT TAATT AAC 

mm* 4600 

HETILETHRTHRGLUGLNGLUILEGLNPHEGLNGLN5ERLY5AS NSERLY5PHELYSA5N 
ATGATCACT ACAGAACA AGAAATACAATTTC AACA ATCAAAAAACTCA AAATTTAAAAAT 

• « • • • • 

PHEARGYALTYRTYRARGGLUGLYARGASPGLNLEUTRPLYSGLYPROGL YGLULEULEU 

TTTCGGGTCT ATTACAG AG AAGGCAGAGATCAGCTCTCGAACGGACCCGGTG AGCTATTG 

* • 4700 « • « • 
TRPLYSGLYGLUGLY ALAVALILELEULYSV ALGLYTHRASP I LEL YS VALVAL PR0AR6 
TGGAAAGGGG AAGGAGC AGTCATCTTAAACGT AGGAAC AGAC ATTAAGGTAGTACCC AGG 

4600 

ARGLYSALALYS ILE ILE LYSA SPTYRGLYGLYGLYLYSGLUMETASP SERSERSE RHI S 

QMETGLUGLUGLULYSARGTRPILEVALVALPROTHR 
AC A A AGGCT AAA ATT ATC A AAG ATT ATGG AG GAGGAAAAGACATGGATAGTAGTTCCCAC 

• • « • • • 
HETGLUASPTHRGLYGLU AL AARGGLUVALALA 

TRP ARG ILE PR OGLUARGLEUGLUARGTR PHIS SE RLE U ILEL Y5TY RLEULYSTYRLYS 
ATGGACGATACCGGAGAGGCTAGAGAGGTGCC ATAGCCTC ATAAAATATTTG AAATATAA 

V*00 
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THRLYSASPLEUGLNLYSALACYSTYRVALPROHlSHlSLYSYAtGLYTRPALATRPTRP 
AACTAAAGATCTACAAAAGCCTTGCTATGTGCCCCATCATAAGGTCGGATGGGCATGGTG 

TMRCY5SERARGV At, IL EP HE PROLEUCLNGLUGL YSERH1 SL EUGL U V ALGLNGL YT YR 

CACCTGCAGC AGAGT AAT CT TCCC ACT AC AGGAAGG A AGCC ATTT AGA AGTACA AGGGT A 

5000 . . • • 

T RP ASNLEUTHRPROGLUARGGLYTRPLEU SERTHRTYRAL AVAL AR GILETHRTRPTYR 

TTGGAATTTGACACCAGAAAGAGGGTGGCTCAGTACTTATGCAGTGAGGATAACCTGGTA 

serlysaspphetrpthrasp VALTHRPROGLUTYRALAASP ILELE UL EUH I S SER THR 
CTCAAAGGACTTTTCGACAG ATGT AACACCAGAATATGCACATATTTT ACTGCATAGCAC 

TYRPHEPROCYSPHETHRALAGLYGLUVALARGARGALA ILEARGGL YGLUARGLEULEU 
TT ATTTCCCTTGCTTTAC AGCGGGAGAAGTG AGAAGGGCC ATCAGCGGAGAACGACTGCT 

5200 

SERCYSCYSARGPHEPROARGALAHISLYSHISGLNVALPROSERLEUGLNTYRLEUALA 
GTCTTCCTGC ACGTTCCC AAGAGCTC AT A AGC ACC AGGTACC AAGTCT AC AGTACTTAGC 

. • • • • • 

LEUARGVALVAL5ERHI SV AL ARGSERCLNGLYCLUASNPROTHRTRPLYSGLNTRP ARG 

X MET 5E RASP PRO ARGGLUARGILE PRQPROGLYASNSERGLYGLU 
ACTCACAGTAGTAAGTCATGTCAGATCCCAGGGAGACAATCCCACCTGGAAACAGTGGAG 

5300 ...» 
ARG ASPASNARGARGSERLEUARGV ALALALYSGLNASNSERARGGLYASPLYSGLNARC 
CLUTHRILECLYGLUALAPHEGLUTRPLEUASNARGTHRVALGLUGLUILEASNARCGLU 
AAGAGACAAT AGGAGAAGCCTTCG AGTGGCT AAACAGAACAGT AGAGG AGAT AAACAGAG 

5^00 

GLYGLYLYSPROPROTHRGLUCLYALAASNPHEPROGLYLEUALALYSVALLEUGLYILE 
ALAV ALA5NHISLEUPR0ARGGLULEU ILEPHEGLNVALTRPGLNARGSERTRPGLUTYR 
AGGCGGTAAACC ACCTACCG AGGGAGCTAATTTTCCAGGTTTGGCAAAGGTCTTGGGAAT 

• • • • • • 

LEUALA 

" TRPHI SASPGLUCLNGLYHETSERGLNSERTYRTHRLYSTYRAR6T YRLEUCYSLEUILE 
ACTGGC ATGATGAACAAGCG ATGTCACA AAGC TATACA AAATACAGATACTTGTGTTTAA 

5500 

GLNL YSALALEUPHEMETHI SCYSLYSLYS GLYCYSARGCYSLEUGLYGLUGLYHISGLY 
TACAAAAGGCTTTATTTATG CATTGC AAG AA AGGCTGT AGATGTCTAGGGGAAGGACACG 
. 

ALACLYGLYTRPARGPROGL YPRO PRO PR 0 PRQPROPROPROGLYLEUALA R HETGLU 
GGGCAGGGGGATGGAGACCAGGACCTCCTCCTCCTCCCCCTCCAGGACT AGC ATAAATGG 

. 5600 • • 

GLUARGPROPROCLUASNCLUGLYPROCLNARGGLUPROTRPASPGLUTRPYALVALGLU 
AACAAAGACCTCCACAAAATGAAGGCCCACAAAGGGAACCATGGGATGAGTGGCTAGTGG 

5700 

VALLEULYSGLULEUL YSGLUGLUALALE UL YSHI SPHE ASP PROARGCEULEUTHRALA 
AAGTTCTGAAACAACTGAAAGAAGAAGCTTTAAACCATTTTGATCCTCCCCTTCTAACCG 

• 

TAT1 NETGLUTHRPROLEUARGGLUGLNGLUASNSER 
LEUCLYASNHIS ILETYRASNARGHISGLYASPTHRLEUGLUGLYALAGLYGLULEUILE 
CACTTGGTAATCATATCT AT AATAGACATGGAGACACCCTTGAGGGAGCAGGAGAACTCA 

. . . 5800 

LEUCLUSERSERASNGLUARGSERSERTYRILESERCLUALAALAALAALAILEPROGLU 

ARGILELEUGLNARGALALEUPHE ILEHI SPHEARCSERGLYCYSSERHI SSERARGILE 
TTAGAATCCTCCAACGAGCGCTCTTCATACATTTCAGAAGCGGCTGCAGCCATTCCAGAA 

• • • • * 

SERALAASNLEUGLYGLUGLUILELEUSERGLNLEUTYRARGPROLEUGLUALACYSTYR 

GLYGLNPROGLYGLYGLYASNPROLEUSERTHRILE PROPROSERARCSERMETLEU 
TCGGCC AACCTGGGGGAGGAAATCCTCTCTCA ACT ATACCGCCCTCTAGAAGCATGCTAT 

. 59 00 • • ■• * 

ASNTHRCYSTYRCYSLYS LYSC YSCYSTYRH I SCYSGLNPHECYSPHELEUL YSLYSGLY 
AACACATGCT ATTGCAAAAAGT6TTCCTACCATTCCCAGTTTTGTTTTCTTAAAAAGGGC 

, . • • • 

LEUGLYILESERTYRGLULYSSERHI SARGARGARGARGTHRPR0LYSLY5ALALY5ALA 
ARTiMETARCSERHISTHRGL YGLUGLUGLULEUARGARCARGLEUARGLEU 

(fig. IB-suite 4) 
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TTCCCCATAACTT AT GAG A ACT C AC AC AC C AC * A G A AC AACTCCCAAC AACGCT AAGCCT 

* ILEH^SLEULEUM SG^N^HRS^RL YSTYRCLYLEUSERTRPIYSSERALAAL 

ENV neTCLYCYSlEUCLYASNGLNLEULEUlLEALA 

aatacatcttctccatcaaacg act aagt at gggt tgtcttggaaatc agctgcttat cc 

6100 

HI5LEULEU 
ILEO 
CCATCK 

PROALATRPARGASNALATHRILE PROLGUPHEC YS AL ATHRLYS ASNARCASPTHRT'RP 
TACC AGCTTGGAGGAATGCG AC AATT CCCCT CTTCTGT GCAACC AAGAAT AGGG AT ACTT 

,62 00 • • • * 

GLYTHRTHRGLNCYSLEUPROASPASNASPASPTYRSERGLULEUALALEUASNVALTHR 

GGGG AAC AACTC AGTGCCT ACC AGAT AATGATG ATT ATTC AGAATTGGCCCT TAATGTTA 

9 # ©30O 

CL USERPHEASPALAT RP CLUASNTHRVALTHRCUOGI-NALA ItEGtUA SPVALTRPGLN 
C ACA AACCTTT6ATGCTTCGGACAAT ACAGTCAC AC AACAGCCAAT A6AC6AC6TATCGC 



* YSSE RLYSCY5L EU TRPILE ILECYS JLECLNTYRVALTHRVALPHETYRGLYVAL 
f GCTCT AAGTGTCTATGGATT ATTTGTATTC A AT ATGTCACAGTCTTTT ATGGTG 



LEUPHEGLUTHRSERILELYSPROCYSVALLYSLEUSERPROLEU^ 
AACTCTTTCACACCTCAATAAAGCCTTGTGT AAAATT ATCCCC ATT ATGC ATTACTATGA 

. . 6400 • • 

CY SASNLYSSERGLUTHRASPLYSTRPCLYLEUTHRLYSSERSERTHRTHRTHRALASER 
GATGCAATAAAAGTGAGACACATAAAYGGGG ATTGACAAAATCATCA4CAAC AACAGCAT 

THRTHRTHRTHRTHRTHRAL ALYS SERV ALGLUTHRARGASP 1^ 
CAAC AACAAC AACAACAACAGCA AAATCAGT ACAGACAACAGACAT ACTCAATGACACT A 

PR OC YS VALVALHI SASP ASNCYSTHRGLYtEUGLUGLNGLUPRG 
GTCCTTCTGTAGTTCATCAT AATTCCACAGGCTTGGAACAAGAGCC AATGAT AAGCTGTA 

PHEASNMETTHRGLYLEULYSARGASPLYSL YSL YSGLUTYRASNGLU^ 
AATTCAACATGACAGGGTTAAAAAGAGACAAGAAAAAGGAGTACAATGAAACTTCCTACT 

• • * 

ALAASPLEUVALCYSGLUGLNGLYASNSERTHRGLYASNGLUSERARGCYSTYRMETASN 
CTGC AG ATCTGGTTTCTGAACA AGGG AATAGC ACTGGTAATG AAAGT AGATG7T AC ATGA 

. . 6700 • • 

HI SCYSASNTHRSERY AL IL E GCNGCUC Y SCYS A S P L YS A ^ a TTr CGATGCT ATT A^** 
ATCACTGTAATACTTCTGTTATCCAAGAGTGTTCTGACAAAGATTATTGGGATGCTATTA 

• • " # 

CY SARGTYRCY5 ALAPROPROGLYTYR ALALEULEUARGCYSASNASPTHRASNTYRSER 
C^jCYAGATATTGTGCACCTC^ 

CLYPHEHETPROASNCYS SERLYSVALVAL VALSERSERCYSTHRARGHETMETGLUTHR 

caggot"tgcctaactgttctaaggtagtggtctct 

GCNTHRSERTHRTRPPHE ARGPHEASHGLYTHRARCALACLUAS^ 

cacagacttctacttggtttcggtttaatggaactagagcagaaaatagaacctatattt 

• • • * 

TOPHtsn* YARGASPASNARGTHRILE ILESERLEUASNL YSHI 5TYRASNLEUTHRHET 
ACTGGCATGGTAGAGATAAT AGGAC^ 

. • 7000 • • 

I Y^CYSARCARGPROGLYASNLYSTHRYALLEUPROVALTHRlLEfiETSERALALEUVAL 

T6AAATCT ACAA6ACC ACCAA 

• • • * * 

PHFHISSERGLNPR0VALASNGLUARCPROLYS6t.NALATRPCYSARGPHEGLYGl.YASN 
TTTTCCACTCACAACC AG TCAATGAGAGGCCAAAGCAGGCATGGTGTAGCTTTGGAGGAA 

TRPLYSGLUALAILELYSGLUYALLYSGLNTHRILEVALLYSHISPROARGTYRTHRGLt 

attggaaggaggcaataaaagacgtgaagcagaccattg 

THRASNASNTHRASPL YS ILEASNLEUTHRALAPROARGCLYGLYASPPROGLUVALTHR 

caactaacaatactgataaaatcaatttgacgcctcctagaggagcagatccggaagtta 
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• TAT2*R0P;0ILEPRaA S ;»RGIL|«|SL|OC«CLNP«0L«L« 
ART2v»LASPPR0TT»PB0THRCLrSE«CLrSER»LA«KGLK»KC« 

8 ?.?P... iuii ai athRALAPROCLYLEUGLYARG •TAT(fin) 



-(£ is. IB-suite 6> 



17/35 

5 ERPH6PR0ASPP«0P«0THRA5PrHRPR^ 

TTCATT TCCTG ATCCGCC AACTGATA^ 
LEUALULWLUSERILEPROASPPROFROTHJJSHILEPROCLU^ 

c B^cgTg^ 

. • * F METGLtGLYALA 

ARGARGILEARGARGSERPROGLNALA«jART2 uG LNTYRGLYTRPSERTYR 

.> 0 r^rrrc 5 o L 0 r 0 ^; L c L c5r 1 "=§ L c £ Trcifc^i«;« B ^«»,. : cco,cc 1 cc ! 
r t ;;^i^ir c r 0 v o?^cr 1 ^r 0 L cJf 0 "AT L c?rc R c c « c i^o»c,c, T occoococ=Tc 

^APCASHmC.VA.T^ 

cc Saa^"c^ 

CL ru E U« S pCr SC U LE UsU S « LEU S £ PCV 5 0 L U0 L «L N ,.YSTVP.S N C L N0L«t U 
C0l^t«"rA^«TT 0 0^cf U crc?C E TS^T*CA< : 00CC 4 AAMT.C.»TCAO0= 1 O» 

jACTTAGAAAAGGAAGAAGGCATC ATACCAGAI ^ 

CACCCACTTTCTTCAT6TATAAATATCACT6CATTTCGCTCTGTATTCAGTCGCTCT6CG 
.ACAGOCTGGCAGATTGAGGCCIGGGAGGTTCTCTCCAGC.CT.GCAGOTAGAGCCTGGG 
TCTTCCCPOCtACACTCrc'ACCAOCCTTOOCCOCTCCTOCCCACAOTOOCTCCACOCJT 



(f ig-lB-suite 7) 



WO 88/05440 



PCT/FR88/00025 



18/35 
FIG, 1C 

s e quence LTR 
CIVET 
versus 
HIV-2 ROD 



X 8960 8970 8980 8990 9000 9010 

TGGAAGGGATTT ATTAC AGTGCA AGAAGACATAGAATCTTAGACATATACTTAGAAAAGG 
•««•«••«•• * ■■•••««« •••••««••«• 2*5553* s SS5 55555S55SSS35 

tggaagggatgttHacagtgaaagaagacataaaatcttaaatatatacttagaaaagg 

X 8950 8960 8970 8980 8990 

9020 9030 9040 9050 9060 

aagaaggcatcataccagattggcagatacactccgga — ccaggaattagatacctaa 

"•3323* - S3 55 5 * 5 5 3 5 5 53533 55 5 5 5 5555 5 5 3 5 3 5 5 5 55 

aagaagggataattgcagattgg 

9010 9020 9030 9040 9050 

9080 9090 9100 9110 9120 

acatgtttggctggctatggaaattaatccctgtaaatgtatcagatgaggcacaggacg 

5 5 55533 5:333553533 33 3 33 553 35 33 33 3 33 3 35 35 

tgttctttcggtggctatggaacctactaccactagatgtcccacaagaaggggaggaca 

9070 9080 9090 9100 9110 

9140 9150 9160 9170 9180 

atgaggagcattatttagtgcacccagctcaaacttcccagtgggatgacccttggggag 

• • • • • • * 53555 33 35 55* 33*53 * 355 553 5 5 5 5 3 5 5 5 

CTGAGACTCACTGCTTACTACATCCAGCACAAACAAGCAAGTTTGATGACCCGCATGGGG 
9130 9140 9150 9160 9170 

9200 9210 9220 9230 9240 

AGGTTCT AGCATGGAAGTTTGATCC AACTCT AGCCT ACACTTATGAGGC ATATATT AGAT 
S3 5333 355 5535355533 35 55 55 5 555 55553 5 5555 5 5 

AGACACTAGTCTGGGAGTTTGATCCCTTGCTGGCTTATAGTTACGAGGCTTTTATTCGGT 

9190 " 9200 9210 9220 9230 

9260 9270 9280 9290 9300 

ACCC ACAAG AGTTTGGAAGCAAGTCAGGCCTGTCAGAGAAAGAGGTT AAAAGAAGGCT AG 

5553335 55 55555 ••«•••«•••*•• • • • • « •••*• • « •• 

ACCCAGAGGAATTTGGGCACAAGTCAGGCCTGCCAGAGGAAGAGTGG AAGGCG AGACTGA 
9250 9260 9270 9280 9290 

9320 9330 9340 9350 
CCGCA AGAGGCCTTCTTGAAATGGCT-GACAGG AAGG AAACT 

5SSS5SS5 55 5 35555533 3 

AAGCA AGAGCAATACCAT TTAGTTAAAGACACGAACAGCT ATACTTGGTCAGGGCAGGAA 
9310 9320 9330 9340 9350 
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9360 9370 9380 9390 
AGCTGAGACAGCAGGGACTTTCCACAACGCGATGTCATC — GGC A 

GTA ACTAAC AGAAACAGCTG AGACTGC AGGGACT TTCCACAAGGGGCTGTAACCAAGGGA 
9370 9380 9390 9400 9410 

9400 9410 9420 9430 9440 9450 

GGTACTGGGGAGGAGCCCGTTGGGAACACCCACTTTCTTGATGTATAAATATCACTGCAT 
; : : : ::::::::: : : : : : : : : ; ::::::::::: * : : 

GGG ACATGGCAGGAGCTGGTGGGGAACGCCCTC ATATTCTCTGTATAAATATACCCGCT A 

9430 9440 9450 9460 9470 

9460 XX 10 20 30 40 

TTCGCTCTGTA — TTCTGGAAGGGATTTATTAC AGTGCA AGAAG ACATAGAATCTTAGAC 

: ::::::::::::: : :::::::: ::::::::::: 22:222: i 

GCTTGCATTGT ACTTCTGGAAGGGATGTTTTACAGTGAAAGAAGACATAAAATCTTAAAT 

9490 XX 10 20 30 40 

50 60 70 80 90 

ATATACTTAGAA AAGGAAGAAGGCATC ATACCAG ATTGGCAGAT ACACTCCGG A CCA 

::::::::::::::::::::::: :: :s s:s 
ATATACTTAGAAAAGGAAGAAGGGATAATTGCAGATTGGC'AG AACTACACTCATGGGCC A 

50 60 70 80 90 100 

110 120 130 140 ^50 

GGAATTAGATACCTAAAGATGTTTGGCTGGCTATGG AAATTAATCCCTGTAAATGTATC A 
: : : : ::::::: :: : : : : : : : : 22 222 222: : : 

GGAGT AAGATACCC AATGTTCTTTGGGTGGCTATGG AAGCT AGTACC AGTAGATGTCCC A 
110 120 130 140 150 160 

170 180 190 200 210 

GATGAGGCAC AGGAGGATGAGGAGCATTATTTAGTGC ACCC AGCTCA A ACTTCCC AGTGG 

: : ; t 2 2 2 2 22:2 : s 2 2 :: 2 2 2 3 2 2 2 2 s 2 2 2 2 2 2:22 
C A AGAAGGGGAGGACACTGAGACTC ACTGCTTAGTACATCC AGCACAAACAAGCAAGTTT 
170 180 190 200 210 220 

230 240 250 260 270 

GATGACCCTTGGGGAGAGGTTCT AG CATGGAAGTTTG ATCCAACTCT AG CCT AC AC TT AT 
:::::::: 5:555 : : : 5 222 322:232222 s::5::s::: 
G ATG AC CCGC AT GGGG AG AC ACT AGTCTGGGAGTTTGATCCCTTGCTGGCTTATAGTTAC 
230 240 250 260 270 280 

290 300 310 

GAGGC ATATATTAGATACCCAGAAGAGTTTGGAAGC A 

22552 5 2222 2 

GAGGC TTTTATTCGG 
290 
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( HIV-2.P 
FIG . 2 ( versus 
' .( HIV-l.P 

^ ^ env4 

KIV2 . _ !Uu!QLlIA I LLA -SAC L V V^V^ CVPTUK^TI 

HIV1 MRVKERYQBt WRWCWKWGTK LLGIUtlCSA TEKLWVTVYY CVPVWKEATT 



5 



io env5 90 100 



KIV2 PLFCAT. RKR- -DT UG TIQCLPDitDD ^MTT,-HVT EAFDAWl^TY 

KIV1 TLFCASDAKA YDTEVHHVWA THACVPTDPN PQEVVLVKVT ENFNMWKMDM 

. n 110 L 120 env6 130 140 150 

X E1V2 TEQAIEDVWH LF ETSIKPCV jCLTPLCVAjlKj C SSTESSTGN KTTSKSTSTT 

** ±* * *************** * * 

HIV1 VEQMHEDIIS LWDQSLXPCV KLXPLCVSLK CTDL GK ATHTHSSNTH 



160 170 130 190 200 

EIV2 --TTTPTDQE QEI SEDTPCA RADNCSGLGE SETIHCQFXM TGLERDKKKQ 

15 * *** 

HIVl SSSGEMMMEK GEIR 3CSFNIS TSIRCKVQKE YAFFYKLDII 



2*30 env7 240 Jr 250 



HIV2 Y--NET-WYS KVYCETNSST MQTQCY HNBC, MTSVITESCP KHYWPjAT RFR 

HIVl PIDHDTTSYT TSC NTSVITQACP KVSFEPIPIH 

20 

260 env8 270 280 290 300 

HIV2 YCAPPGYAJJ. RC-HPT.- BYS GFAPNCSKVV ASTCTRMMET QTSTWF-GFH 

HIV 1 YCAPACFAIL KCNNKTFNCT GP CTHVS TVQCTHCIRP VVSTQLLL-H 



1 



25 " 

310 320 330 340 350 

KIV2 GTRAE H RTYIYWHGRD K-RTII-SLN KYYKLSLKCK RPCNKTVKQI 

* ** * * * *** ** ******* 

BIV1 GSLAEEEVVI RSAMFT D NAKTI IVQLH QSVE— IHCT RPNNNTRKSI 



3 to env * 



360 370 cl4V ' 380 390 400 

30 HI v2- MLMS— CHVr HSKYQPI HKR PR0AWCV7FKG -KWKD AMQEV KETLAKHPRY 

* * * *«* * «* * * 

KIV1 R IQRGPG RAF VTIGKlGIi— MRQAHCSISR AKWIlAT L KQIASKLRSQ 
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I envlO 440 450 



HIV2 RGTNDTRN I S FAAPCM TP I U MIUI I^T 

H1V1 FGHNKT-II JkQM-MW EIVTHSFNCG GEFFYCNSTQ LFH STVJFNST 



Aftn J/ 470 envll 480 490 50 ° 

-EK rTTlfrT--" VGRKVWP* EGELSCNSTV 



HIV2 -EI! K T^RK YAP C H T>nim»> ll T*,ft 

5 [IT1 WSTEGSNNTE GSDTITLPCR IKQF INMWC.E VGKAMYAPP I SGQIRCSSHX 



io HIV1 - 



** 

HIV1 WSTEGSNNTE GSDTIT! 

V 

HIV2 - TSIIANIDwJ NNNQTN ITFS AEVAELYR^- -ELGDYKLV EITPIGFA|T_ 

tollltooo nnnngseifr fgccdhrdnw rselykykvv kieplgvapt 
HI va SkuiK retrgvfvlg -f.gfJ^ "^J- ltj^q-Sl 

HI71 KAKRR-VVQ. REKRAVGI-G ALFLGFLGAA GSTMGARSMT LTVQA-RQL 

15 • £ , n 620 630 i 6*0 envl 650 

.„,__ ^iwUS t»mMj. ii«iin!» »a ii"! T : ipk'W 

„„, LSGIVQQQHH LLRAIEAQQH uqlTTCOK W A*ILAV t 

670 680 650 700 

20 „ « CC a«5J! HTT7PW— VKDSLAPDWD HMTWQEWEKQ VRYLEANISX. 

HIV2 SWGCAFKQVC. ^ # * **** ** * 

HIV1 ivTcSGKLIC KAWWm SKKSLEQIUH SMTWUEBDRB IHHTTSLSIiS 

25 Hiyl liees^nqqe oeqelleld kwaslwnwfn itnwlwyiei fimivgglvg 
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780 500 
„, .... UUVIVVV^ L,.IB«U »-»«»•" „,.!«»« q»«««J» 
**** * * * ** * teMT HLPTPRG PDRPEGIEEE 



B 

KIVl 



LRIVrAVLSI VNRVRQGYSP LSFQT— — ULPTPI 



* 0#>n 830 840 350 

c 810 820 , LYSIC RDLLSRSFLT 

5 HIV2 - GGSHGCDETW PWPIAYIRFI- IRQLIRLLT KSIC 

a ** ** r cvwRL- - RDLLLIVTRI 

HIV1 GGERDRDRSI RLVHGSLA— L IWDLULCl TSYHRL 

8S q 890 * 900 

H1V2 LQLIYQNXRD WLRLRTA— — F LQ*GCEVI Q E A ? Q— AAA RATRETL— 

10 ""__„-- LQYWSQE'LKH SAVSLLNATA IAVAEGTDRV 



H1V2 agacrg innnS! «lavtrrir qcaeiall 

^ HIV1 IEVVQGACRA IRHIPRRI* QO"""- 



938 



(fig. 2 - suite 2) 
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( ENV-mac 
FIG . 3 ( versus 
~ ( SMV-ROE 



10 20 30 AO 50 

MGCLGNOLLIAIC— S KCL W 1 1 CI QYVTVF YG VP A WRN AT I P LFC ATKNRDT WGTT QCL 
. ::::::: : : s : •••»••••!• : s s s s : s : : J s ::::::: : : : 

HM NQLLI AILLAS ACLVY— CTQYVTVFYGVPTWKNATIPLFCATRNROTWGTI QCL 

10 20 30 AO 50 

60 70 80 90 100 110 

PONDDYSELALNVTESFDAWENTVTEOAIEDVWQLFETSIKPCVKLSPLCITMRCNKSET 

:::::: : : : : : : : : : : :::::::::::: : : : : : : 

PDNDDYQEI TLNVTE AFDA WNNT VTEQAI EDVWHLFETS IKPC VKLTPLCV AMKCSSTES 
60 70 80 90 100 110 

120 130 140 150 160 170 

DKWGLTKSSTTTA5TTTTTTAKS VETROIVNETS PCVVHDNCTGLEQEPMI SCKFNM 

: : : :::::s : : : : ^ :::::::: ::: 

STGNNTTSKST — STTTTTP T-DQEQEISEDTPCARADNCSGLGEEET INCQFNM 

120 130 140 150 160 

180 190 200 210 220 230 

TGLKRO KKKEYNETWYS ADLVCEQGNSTGNESRCYMNHC NTSVIOECCDKDYWDAIRCRY 
::: ::::: ::::::: : s:: ::s : ::::::::s:s : s:s sss::. 
TGLERDKKKQYNETWYSKDVVCETNNST— NQTQCYHNHCNTSVI TESCDKHYWDAI RFRY 
170 180 190 200 210 220 

240 250 260 270 280 290 

CAPPGYALLRCNOTNYSGF MPNCSKVVVS.SCTRMMETQTSTWFRFNGTRAENRTYI YHHG 



CAPPGYALLRCNOTNYSGF APNCSKVVASTCTRMME TQTSTWFGFNGTRAENRTYI YHHG 
230 240 250 260 270 280 

300 310 320 330 340 350 

RDNRTIISLNKHYNLTMKCRRPGNKTVLPVTIHSALVFHS— OP VNERPKQAWCRFGGNW 
::::::::::: : J : : : : : s : : : :!!! ss : ss s!!! * * * 

RDNRTI I SLNKYYNLSLHCKRPGNKTVKQ IMLMSGH VFHSHYQP I NKRPRQ AWCWFKGKW 
290 300 310 320 330 340 

360 370 380 390 400 

KEAI KEVKQTI VKHPRYTGTNNTDK INLTAPRGG— OPEVTFMHTNCRGEFLYCKMNWFLN 

. s : : : : ::::: : : : ; s :t : Jts: 

KDAMQEVKETLAKHPRYRGTNDTRN IS FAAPGKCSD PEVfcYHWTNCRCEFLYCNMTWFLN 

350 360 370 380 390 400 
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i. 2 Q 430 440 « 50 4,60 

u VE DR *JLTT QKPKER HKRN Y VPC HI RQ I IN T WHK VG KNVYL P P REGDL TCNST VT SL I AN 

. . . • : • : : : : : :::::::::: ::::::::: : ::::::: : : : 

u,c V KT-H-RNYAPCHIKQ 1 1 NTMHKVGRNVYLPPREGELSCNST VTS I IAN 

410 420 430 440 450 

480 490 500 510 520 

I NHTDGNQT 5 I TMS AE V AELYRLEL GO YKL VE I T P I GLAP TNVKR YT TG-GTS RNKR GVF 

. . : : : : : :::::::::::::::::::::::: : : : : : : : • « 
IDWONNNQTNI TF SAE V AELYRLELGD YKL VE I TP I CF APTKE KR YSSAHG— RHTRGVF 
460 470 480 490 500 510 

540 550 560 570 580 

YLGFLGFLATAGSAMGAASLTVTAOSRTLLACI VQQOQQLLDVVKROOELLRLTVHGTKN 

::::::::::::::::: : : s : : ::::::::::::: s :::::::::::: 5 : : : : : : : : ' V 
VLGFLGFLATAGSAMGAASLT VS AQSRTLLAGI VQQQGQLLDVVKRQQELLRLTVWGTKN 

520 530 540 550 560 570 

600 610 620 630 640 

LOTRVSAIEKYLKDOAOLNAWGCAF RQVCHTTVP WP NASL TPDWNNETWQE WERK VDFLE 
: : : : : : : : : : : : : : : : :::::: s - 

LOARVTA IEKYLQDQARLNSWGCAF RQVCHTTVPWVNDSLAPDWDNMTWQEWEKQVR YLE 
580 590 600 610 620 630 

660 670 680 690 7o'o 

ANITALLEEAQIQGEKNMYELQKLNSWOVFCNWFOLTSWIKYIQYGIYIIVGYILLRIVI 

s : s s : ::::::::::::::::::: ::::::: s : J :::::: : : : : : : : : : : 
AN I SK SLEQ AO I Q QE KNMYE LQKLN'S WDI F GNWFDLTS WVKY I QYG VL 1 1 VAV I ALR I VI 

640 650 660 670 680 690 

720 730 740 750 760 

Y I VQMLARLROGYRP VF 5SPPSYFQ *THTQQ0P ALPTKEGKKGDGGGSGGNSS WP WO IEY 

: : i s ' s ' ' ! : : : : : 
YVVQMLSRLRKGYRPVFSSPPGYIQQIHIHKORGQPANEETEEDGGSNGGDRYWPWPIAY 

700 710 720 730 740 750 

780 790 800 810 820 

I HFL IRQLI RLLTWLFSNCRTLLSRAYQI LQP IFQRLSATYGEFGEVLRLELTYLQYGWS 
::::::::::::: : : :: :::s :: : : : sss ::is 

I HFLI RQLI RLLTRLYS ICRDLLSRSFLTLQL IYQNLROW LRLRT AFLQYGCE 

760 770 780 790 800 

840 850 860 870 880 

YFQEA VQAA-RDLRQRLLRA— RGEKLWEALQRGGRW I LA I PRR I RQGLELTLL 

::::::: : : : : : : : : : s : : s s : t s : : : s * a 
WI QEAFQAAARATRETLAG ACRG-—L WRVLERI GRG ILAVPRR IRQGAE I ALL 

810 820 830 840 850 
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( GAG-mac 
FIG. 4 (versus 
(GAG-ROD 



10 20 30 «0 50 

VQHKKE I AVFYPGRDNK IE WEMGARNSVLSGKKAOELEK IRLRP^ 

:::::::: :::::::: :; f 

HGARNS VLRGKK ADELER IRLRPGGKKKYRLKH I VW AAN 

10 20 30 

70 80 *?0 100 110 

ELDRF GLAE SLLENKE GCQK ILS VLAP LVP TGSENL KSLYNT VCV I WC IHAEE KVKHTEE 

:::::::: s s : : s : : : s : : : : : 

KLDRFGLAESLLESKEGCQKILTVLDP MVPTGSENL KSLFNTVCVI WCIHAEEKVKOTEG 

40 50 60 70 80 90 

130 140 150 160 170 

AKQ I VQRHL VMETGTAETMPKTSRPTAPFSGRGGNYP VQQ IGGNYTHLPLSPRTLNAHVK 

..... :::: :::::: : sum :::::s 

AKQ I VRRHL VAETGTAEKMPSTSRPTAPSSEKGGNYP VQHVGGNYTH IPLSPRTLNAHVK 

10 0 110 120 130 140 150 

190 200 210 220 230 

LIEEKKFGAEVVSGFQALSEGCLPYOINQMLNCVGDHQAAMQIIROIINEEAAOHDLOHP 

• :::::::::: ss::ssss« issss**ss*S5! sssssssss :::::: 

LVEEKKFGAEVVPGFOALSEGCTPYDI NQttLNCVGDHQAAMOI IRE I INEEAAEHOVOHP 
160 170 180 190 200 210 

250 260 270 280 290 

QOAPQQ— GOLRE PS GSD I AGTTSTVEEQI QHMYRQQNP IPVGNI YRRHI QLGLQKC VRMY 

: :::::: :::::::::::: : : : : : : : « • • : s s s : : : : : s : s 

I PGPLP ACQLRE PRGSOI AGTTSTVEEQI QWMF RPQNPVPVGN IYRRW I QIGLQKCVRMY 
220 230 240 250 260 270 

, nrt 3 ro 320 330 340 350 

NPTNILDVKQGPKEPFQSYVORFYKSLRAEQTDPAVKNWMTQTLLIQNANPDCKLVLKGL 

:s::s:: !::::::::::::s5S!J!JS'i"- !IS!:::::: :« • 

NPTNI LD IKQGPKEPFQSY VORFYKSLRAEQTDPAVKNWMTQTLLVQNANPOCKLVLKGL 

280 290 300 310 320 330 

uo 370 380 390 400 410 

GTNPTLEEHLTACOGVGGPGOKARLMAEALKEALAP AP I PFAAAQQKGPRKP IKCWNCGK 

i :::::: s s s :jj:s:::s!s ' ' s 

CHNPTLEEMLTACQGVGGPGQKARLMAEALKEVIGPAPIPFAAAQO RKAFKCWNCGK 

340 350 360 370 380 390 
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£Ss»ROC«««2oCC«Ke«»HVH« M ^ 

EGHSAROCRAPRROGCHKCGKPCHI MTNCPDRQACFLCLCPHCKKPRKFPVAOVPOGLTP 
^ 00 <t\Q 420 430 

480 ^t90 500 510 

TAP PEEP AVOLLKNYMHLGKOQRES RGKPYKEVTEOLLHLr J* 

T ; P p%0^V0LLEKYM00GKR0^ 



/,50 460 ^70 



(fig. 4 - suite 1) 



WO 88/05440 



PCT/FR88/00025 



27/35 

( POL-mac 
F IG « 5 ( versus 
( POL-ROD 



to 20 30 ^ ^ 

VLELW EGRTLCKANQSPKKTGHLEHWKNGPCYGQMP KQTG GFF RP W-P LGKEAP OF PHGSS 

TCRFFRTGPLGKEAP QLPRGPS 
10 20 

70 80 90 100 

ASGADANCSPRRTSCGS AKELHALGQAAERKOREALQGGORGF 

SAGAOTNSTPSGSSSGSTGE I YAAREKTERAERETI QCSDRGLTAPRAGGDT 
30 40 50 60 ?0 

no 120 130 140 150 160 

-AAPQF SLHRRPVVTAHIEGQPVEVLLDTGAD0SIVTG1 ELGPHYTPK^ 

LMj^S^K^^^rUGOPV^LDTOWOSIV.O.ELONNY^K.VCG^OFINTK 

<J0 100 HO 12° 139 

la0 190 200 210 220 

EYKNVEIEVLGKR IKGT1HTG0TPI NIFGRNLLYALGPSCNLP lAKVEPVKSPLK^GKOG 

„ n nn 250* 260 270 280 

PKtK0HPLSKEKIVALREICEKH6KDGQL££APPTNPYNTPTFMKKK0KNKMR^ 

210 220 230 2*0 250 

ELNRVTQDFTEVOLGIPHPAGLAKRKR JTVLOICOAYFS?PLD 

e:;k;toofte:«:gWhp 8 »olakkrr.tvldygoayF 3 SJPlhedfrpyj o Aftlp S vn«a 

370 380 390 400 

EPGKRY IYKVLPQGHKGSPAIFflYTMRHVLEPFRKANPOVTLVQYMOO JLIA^ 

EPGKRYIYKYLPQGHKGSPAIFQHTMROVLEPFRKANK^ 
330 340 350 360 



FIG. 5 



WO 88/05440 



PCT/FR88/00025 



28/35 



„ 20 00 "0 «0._. J60 



yK » ^ l wlncwl " j » w * «# » ■ - = * - = ; 

;:;^^«i;i^;;iTHi-~ ; ;;!!« ;k -s5S , " t " ,0 i!? , " I " ,n, !iS 



11° 4,20 „J L, ¥ n uPTKHKLQKlELP<3R£ThTVN0IQ 

OR VVLOLKELLNSI 5SP6EKF QKOPPF ???Tf V j j T ; : : : : 5 , 

.KELLNGLGFSTPO 
3<30 * 00 

400 500 510 520 

<»50 *-60 * 70 

^50 560 570 580 

,,.»pJBvl«...i&»?!!«»™ 

YOEEKELEATVQKDQENOHTTKI HQE€ ^ ILKVCKYAKVKNTHTNG I RLLAQVVOK 
510 520 530 31W 

680 690 70° 

630 640 650 6bU 

i;,«; s « 0 E, 6 U«ivii;uEM;K»;;;;..« re »cH«v r vso 6i; .« 

690 700 710 7Z0 

LfL EK,E;«SEE™,KELV F K F ^ 
750 760 '70 

TWQHOCTHLEGKI IlVAVHVASGff I EAEVIPQESGROTALPLLKLASMPITHCHTONGA 
aio ^20 830 " v 

870 8S0 « 90 
«•••« !«•••!!!:::•••• • •••• • * ^ . 



930 940 950 



r rn-nnrr\r\c\w • wi • • * ~- ..... - 

•••••••••• TEOeiOFtOAKNS! 

950 9* 

ELL WKC E Grv?LKVOToi°K"pRRKAKl?r 0 YGCCKE!i 0 0SS S HH 6D T0rA; e VA 

(fig.5-suite 1) 



WO 88/05440 



29/35 



PCT/FR88/00025 



• ::::::: :::::::: j: « ' 

ELLWKGEGAVLVKVGTDIKI IPRRKAKI IR0YGGRQEMOSG5HLEG AREDGEHA 
990 1000 1010 1020 



(fig. 5-suite 2) 



WO 88/05440 



PCT/FR88/00025 



30/35 

( Q .mac 
FIG. 6 (versus 
( Q . ROD 



nEEEKRHIVVpVHRIPERLERWHSLIKYLKYKTKDLQXACYV 
;aOK,;IvV^UvR C R»EK;H;:vK;: r K„ LE KVC ; v P HHKVO«W-TCSRV IF P 

10 20 30 ™ 

on <30 100 HO 

L0 ECSHUva 70 6 rwH L TPER ^V^l^^^^V-^V:^ 

iKC^^E.^^^rjEKi^^siRiTYTEKPWTOmOCAOVUHSTYEPCET^ 
70 80 90 A 

E.RRMRCER^CCRPPRA^VPSLOY^RYYSHV^^ 
^RRMRCEK^^CHYpa^RAi^UiEUJUVVVOOSORPORDSTTRK^ 



40 50 



130 

190 200 210 



RV AKQNSRGOKQRGGKPPTEGANFPGLAKVLGILA 

. ... • : : s : : 

RLAKQOSRS HKORS SESPTPRTYFPGV AE VLEILA 
190 200 210 



WO 88/05440 



PCT/FR88/00025 



31/35 

( R.mac 
FIG . 7 ( versus 
( R . ROD 



ME- — ERP PENEGPQRE PWDEWVVEVLKELKEEALKHFO^ 
MAEAPTELPPVOCTPLREPGOEHI IE1LREIKEEALKHFDPRLLIALCKYIYTRHGOTLE 
10 20 30 40 3U 

fc0 70 80 90 100 

G AGEL IR ILQRALF IHF RSGCSHSR I GQPGGGNPLS TI PP SRSML 

• « • • • • * • j J J * * 

GAREL IKVLQRALFTHF RAGCGHSR IGQTRGGNPLS Al PTPRNMO 
70 80 90 IQO 



WO 88/05440 



PCT/FR88/00025 



32/35 

( X.mac 
F I G . 8 ( versus 
( X.ROD 



iT^^T»;;e««ETUE«»- L N R TV|» 1N RE»V N HLPR6LI F «*HO«» R tHHD E « 

70 80 90 100 HO 

GMSQSYTKYRYLCLIQKALFMHCKKGCRCLGEGHM 

GMSES YTKYRYLC I IQKAVYMHVRKCCTCLGRGHGPCGMRPGPP^ 

70 80 90 10° AiU 



WO 88/05440 



PCT/FR88/00025 



33/35 

( F . mac 
F IG . 9 ( versus 
( F . ROD 



MGGA I SKKRSKPPEI CD— ROSCGRVGRNYGRLFK— GVEDGSSO^ 

;gasg5kkhsrpprglqerllraragacggy W nesggeysrfqe-gsdreqkspscegr 

10 20 30 *0 3U 

ao 90 100 HO 

KYNOGEYMNTPWRNPAEERKKLPYRKONIDOIDEEOOOLyGIPyEARVPLRTMSYKLAID 

QYQOGOFMNTPWKDP'AAEREKNLYRQONHOOVOS 00000 
60 70 80 90 100 

NSHLI KTRCGUE6MFYSERRHKILMIYLEKEECI IAOHQNVTH-CPfi^^ 
120 130 1^0 150 160 

XPV^OEAOEOEE^LVHPAO^ 

VPVOVPQEGEDTETHCLVHP AQTSKFDDPHGETLVW^ 

180 190 200 210 220 

240 250 260 

GLSEKEVKRRLAARGLLEHAORKETS 

: : s : : : : « * ' 
GLPEEEWKARLKARGIPFS 

240 250 



WO 88/05440 



PCT/FR88/00025 



34/35 

( TAT. mac 
F I G . 1 0 ( versus 
( TAT. ROD 



10 20 30 40 50 

METPLREQENSLESSNERSSYISEAAAAIPESANLGEEILSQLYRPLEA 

METPLKAPESSLKSCNEPFSRTSEQDVATQELARQGEEI^ 

10 20 30 40 50 

70 80 90 100 110 

YHCQF CFLKKGLG I SYEKSHRRRRT PKKAKANTS SASNERP I PNR I RLCQPKKAKKE 

• ::::::::: : * : ! s * * 

YHCQMCF LNKGLG ICYERKGRRRRTPKKTKTHPSPT POKS I STRTGD SQ PTKKQKK 

70 80 90 , 100 HO 

120 130 
TVEAAVATAPGLGR. 

: : i 

TYEATVETDTGPCR 
120 130 



WO 88/05440 



PCT/FR88/00025 



35/35 

( ART. mac 
F IG . 11 ( versus 
< ART. ROD 



10 20 30 «0 50 
KRSHTGEEELRRRLRL IHLLHQTSKYGLSWKS AAYRHLLVDPYPTG5GSAN0RRQKRRRW 
s ::::::::::::: :j: : : : <tts 

MNERAOEEGLORKLRLI RLLHQTN PYPOCPGTASQRRNRRRRW 



10 



20 30 «0 



70 80 90 100 110 

RO RHQQLLALAORI YSF POP PTDTPLDLA IQOLQNLA IES I POPPTNI PEALCDLRR IRR 

•i: s ::::: :: : ::: :s :i s : :s:j: sj 

KQRWRQ I LALADSIYTFPDPPADSPLDQT IQHLQGLT IQELPOPPTHLPESGRLAET 

50 60 70 80 90 100 



SPQA. 



INTERNATIONAL SEARCH REPORT 

International Application No 



PCT/FR 88/00025 



I. CLASSIFICATION OF SUBJECT MATTER (if several classification symbols apply, indicate all) 



According to international Patent Classification (IPC) or to both National Classification and IPC 

4 C 07 K 7/10, 7/06, C 12 N 15/00, G 01 N 33/569, 
Int. CI. :a 61 K 39/21, A 61 K 37/02 



il. FIELDS SEARCHED 



Minimum Documentation Searched 



Classification System 



Int. CI. 



Classification Symbols 



A 61 K 3-9/00, A 61 K 37/00, C 07 K 7/00, 
G 01 N 33/00, C 12 N 15/00 



Documentation Searched other than Minimum Documentation 
to the Extent that such Documents are Included in the Fields Searched 8 



HI. DOCUMENTS CONSIDERED TO BE RELEVANT 9 



Category * 



Citation of Document, " with indication, where appropriate, of the relevant passages ia 



X,Y 
X,Y 



WO, A, 86/02383 ( PASTEUR ) 24 April 1986, see 
pages 21-34, 55-60; claims 1-16 

US, A, 4629783 (W.L. COS ANT) 16 December 
1986, see columns 15,16; claims 1-42 

EP, A, 0199301 (HOFFMANN-LA ROCHE & CO.) 
29 October 1986, see columns 27-42; claims 
1-42 

EP, A, 0187041 (GENENTECH) 9 July 1986, see 
pages -79-81, claims 1-18; pages 82,83, claims 
24-38 

Science, vol. 232, 1985, American Association 
for the Advancement of Science, (Washington, 
DC, US) P.J. Kanki et al.: "New human 
T-lymphotropic retrovirus related to simian 
T-lymphotropic virus type III ( STLV-III AGM ) 
pages 238-243 see the whole document 



Science, vol. 233, 18 July 
A s sociation for the Advanc 



1986, American 
ement of Science, 



Releva nt to Claim No. ™ 
1-36 

1-36 



1,2,6-12,14- 
21,24 



1 V 2, 6-12 ,14- 
21,24 



1-36 



1-36 



* Special categories of cfted documents: w 

"A" document defining the general state of the art which is not 

considered to be of particular relevance 
M E" earlier document but published on or after the international 

filing date 

"L" document which may throw doubts on priority claim(s) or 
which is cited to establish the publication date of another 
citation or other special reason (as specified) 

"O" document referring to an oral disclosure, use, exhibition or 
other means 

4, P M document published prior to the international filing date but 
later than the priority date claimed 



M T" later document published after the international filing date 
or priority date and not in conflict with the application but 
cited to understand the principle or theory underlying the 
invention 

"X" document of particular relevance; the claimed invention 
cannot be considered novel or cannot be considered to 
involve an inventive step 

•*Y" document of particular relevance;' the claimed invention 
cannot be considered to involve an inventive step when the 
document is combined with one or more other such docu- 
ments, such combination being obvious to a person skilled 
in the art. 

"&." document member of the same patent family 



IV. CERTIFICATION 



Date of the Actual Completion of the International Search 

10 June 1986 (10.06.86) 



International Searching Authority 

EUROPEAN PATENT OFFICE 



Date of Mailing of this International Search Report 

7 July 1988 (07.07.88) 



Signature of Authorized Officer 



Form PCT/ISA/210 (second sheet) (January 1985) 



International Application No. PCT/FR 88/00025 



Iir. DOCUMENTS CONSIDERED TO SE RELEVANT (CONTINUED FROM THE SECOND SHEET) 


Category * 


| Citation of Document, wrtft indication, whara appropriate, of tha ratevant paaaajaa 


j Ralavant to Claim No 




(Washington, DC, US) F. Clavel et al . : 
"Isolation of a new human retrovirus from 
West African patients with AIDS 11 , pages 
343-3 46 see the whole document 




Y 


Nature, vol. 324, 18/25 December 1986, 
MacMillan Eds . (Londres, GB) F. Clavel et al. : 
"Molecular cloning and polymorphism of the 
human immune deficiency virus type 2", pages 
691-695 see the whole document 


1-36 


v 

X 


LNdLuie f vcj_l. ozx, zz way j-^oo L v iaciYii_L_Lan ijQS . 
(Londres, GB) M. Murphey-Corb et al . : 
"Isolation of an HTLV-III-related retrovirus 
xrom macaques wmn simian AIDS and xts 
possible origin in asymptomatic mangabeys", 
pages 435-43 7 see the whole document 


I— 6 b 


P,X 


WO, A, 87/02038 (ONCOGEN) 9 April 1987, 
see pages 114-117; claims 31-55 


1,2,6-12,14- 
21,24 


P r X 


Journal of Cellular Biochemistry, Supplement 
-lxjj , uu±d oyinposia on ixiojLecuxar oc teiiuiar 
Biology, 29 March - 1 May 1987, Symposium on 
human retroviruses, 16th Annual Meeting 
UCLA, see page 44 r abstract P112: "Human 
rexroviruses , cancer ana aids : approaches to 
prevention and therapy" 


1-36 


P,Y 


FR, A, 2593189 (PASTEUR) 24 July 1987, see 
page 8, lines 17-26; pages 13-15, claims 
1-18 


1-36 


P,Y 


Nature, vol. 326, No. 6113, 9-15 April 1987, 
MacMillan Eds. (Londres, GB) H. Kornfeld 
et al.: "Cloning of HTLV-4 and its relation 
to simian and human immunodeficiency viruses" 
pages 610-613, see the whole document 


1-36 


p,y 


Nature, vol. 326, 16 April 1987, MacMillan 
Eds. (Londres, GB) M. Guyader et al . : 
"Genome organization and trans activation of 
the humen immunodeficiency virus type 2, 
pages 662-669, see the whole document 


1-36 


P,Y 


FEBS Letters, vol. 218, No. 2, June 1987, 
i^u.o • £iXat2v mi oiencc rUDllSQerS n • V • 

(Biomedical Division) , 198 7 Federation of 
European Biochemical Societies M.J.E. 
Sternberg et al . : "Prediction of antigenic 
determinants and secondary structures of the 
major AIDS virus proteins", pages 231-237 


1-36 



Form PCT/ISA/210 (extra aheat) (January t985) 



International Application No. PCT/FR 88/00025 



FURTHER INFORMATION CONTINUED FROM THE SECOND SHEET 



see the whole document 



V 0 OBSERVATIONS WHERE CgRTAJM CLAIMS WERE FOUND UNSEARCHABLE i 

This International search report has not been established In retpect of certain claims under Article 17(2) (a) f6r the followinn 
t. f~l Claim numbers because they relate to subject matter not required to be searched by this Authority, namely: 



2.Q Claim numbers , because they relate to parts of the international application that do not comply with the prescribed require- 
ments to such an extent that no meaningful international search can be carried out, specifically: 



3 J [ claim numbers because they are dependent claims and are not dratted in accordance with the second and third sentences of 

PCT Rule 6.4<s). 



VI.Q OBSERVATIONS WHERE UNITY OF INVENTION IS LACKING * 



This International Searching Authority found multiple Inventions in this International application as follows: 

Claims 1,2,6-21,23-36 

Claims 1,2,6-21,23-36 all in part 3-5 
Claims 23,25-28,34-36 all in part 22,24,29 

1 S As all required additional search fees were timely paid by the applicant, this International search report covers all searchable claims 
of the international application. 

*0 A » on,y 80019 of tne requ^ed additional search fees were timely paid by the applicant, this International search report covers only 
those claims of the International application for which fees were paid, specifically claims: 



&□ No required additional search fees were timely paid by the applicant. Consequently, this international search report Is restricted to 

the Invention first mentioned in the claims; it is covered by claim numbers: 

4.| | As all searchable claims could be searched without effort justifying an additional' fee, the International Searching Authority did not 
— invite payment of any additional fee. ♦ 

Remark on Protest 

| | The additional search fees were accompanied by applicant's protest 

fy] No protest accompanied the payment of additional search fees. 



Form PCT/ISA/210 (supplemental sheet (2)) (January 1985) 



ANNEX TO THE INTERNATIONAL SEARCH REPORT 

ON INTERNATIONAL PATENT APPLICATION NO. FR 8800025 

SA 20445 

This annex lists the patent family members relating to the patent documents cited in the above-mentioned international search report. 
The members are as contained in the European Patent Office EDP file on 23/06/88 

The European Patent Office is in no way liable for these particulars which are merely given for the purpose of information. 



Patent document 


Publication 


Patent family 


Publication 


cited in search report 


date 


membcr(s) 


date 


W0-A- 8602383 




FR-A- 


2571968 


25-04-86 




Alt A 

AU-A- 


enc 1 "70C 


02-05-86 






EP-A- 


0201540 


20-11-86 


- 




JP-T- 


62500592 


12-03-87 






W0-A- 


8604336 


31-07-86 






AU-A- 


5320086 


13-08-86 






EP-A- 


0211022 


25-02-87 







JP-T- 


62502095 


20-08-87 


US-A- 4629783 


16-12-86 


EP-A- 


0201716 


20-11-86 




W0-A- 


8605414 


06-11-86 




- 

* 


AU-A- 


5572786 


ID 1U OO 






AU-A- 


5773386 


1Q-1 1 -QC 
lO 11 OO 






EP-A- 


0220273 


U D U w O / 






JP-T- 


62502617 


UO 1U 0/ 






AU-B- 


C"71 1 OO 


ox uo oo 


EP-A- 0199301 


29-10-86 


AU-A- 


5636386 


23-10-86 






JP-A- 


62012799 


21-01-87 


EP-A- 0187041 


nn riT oc 

09-Q /-co 


JP-A- 


61233700 


17-10-86 


W0-A- 8702038 


09-04-87 


AU-A- 


5299286 


09-04-87 




BE-A- 


905492 


25-03-87 






GB-A- 


2181435 


23-04-87 






FR-A- 


2587720 


27-03-87 






SE-A- 


8604007 


26-03-87 






NL-A- 


8602422 


16-04-87 






FR-A- 


2593519 


31-07-87 






JP-A- 


63068075 


26-03-88 


FR-A- 2593189 


24-07-87 


WO-A- 


8704459 


30-07-87 




AU-A- 


6891187 


14-08-87 






EP-A- 


0239425 


30-09-87 



a For more details about this annex : see Official Journal of the European Patent Office, No. 12/82 



RAPPORT OE RECHERCHE INTERNATIONALE 

Oemande international* N* ^ ° Q/ U 

' j CLASSEMENT PE L'lM VE NTION (s. plusieurs symboies de daas»f.cat»on sont applicable*, las ind . guer tous) [ 

-Salonlaclaiaincafoninternationala dea brevet. (CIB) ou a .a foi. aejon .a claaaifi cation national* at la CIB 

4 C'07 K 7/10, 7/06, C 12 N 15/00, G 01 N 33/569, 
C IB : A 61 K 39/21, A 61 K 37/02 

M. DOMAINES SUR LESOUEUS LA RECHERCHE A PORTE 



Documentation minimale consultee • 



r — "f "; : ~ — i "~* Symboies de daaaifieation 

Systeme de classification 7 „ 



CIB 4 



A 61 K 39/00, A 61 K 37/00, C 07 K 7/00, 
G 01 N 33/00, C 12 N 15/00 



Documentation consultee autre que (a documentation minimale dans la mesure 
ou de teis documents font partie des domaines sur lesquels la recherche a porta • 



ill. oocu 
CaMgori* * 


NENTS CONSIOE«fc» tumms r-urs » mtn . - - 

Identification des documents cites," avec indication, si necessaire, 
des passages pertinents 


N' d«» revendications 
vix.es >» 


X,Y 


wo, 


A, 86/02383 (PASTEUR) 24 avril 1986, 
voir pages 21-34, 55-60; revendications 
1-16 


1-36 


X,Y 


us, 


A, 4629783 (W.L. COSANT) 16 decembre 
1986, voir colonnes 15,16; revendications 
1-42 


1-36 


X 


EP, 


A, 0199301 ( HOFFMANN - LA ROCHE & CO.) 
29 octobre 1986, voir colonnes 27-42; 
revendications 1-42 


1,2,6-12, 
14-21,24 


X 


EP, 


A, 0187041 (GENENTECH) 9 juillet 1986, • 
voir pages 79-81, revendications 1-18; 
pages 82., 83, revendications 24-38 


1,2,6-12, 
14-21,24 


Y 


Science, vol. 232, 1985, American Association 
for the Advancement of Science, 
(Washington, DC, US) P.J. Kanki et al.: 
"New human T-lymphotropic retrovirus 
related to simian T-lymphotropic virus 
type III (STLV-III A gm) 


1-36 



* Categories speciales de documents cites: 11 

« A » document definissant ratal general de ta technique, non 
consider* comme particulierement pertinent 

« E a document anterieur, mais publi* a la date de depot interna- 
tional ou apres cette date 

i[ i document pouvant jeter un doute sur une revendication de 
priorit* ou cite pour determiner ia date aa publication d una 
autre citation ou pour une raison speciale (telle qu indiquee) 

« 0 » document se referant a une divulgation orale, a un usage, a 
una exposition ou tous autres moyens 

« P » document publie avant la data da depot international, mais 
posterieurement a la date de priorite revendiquee 



< T » document ulterieur publie posterieurementaladatede depdt 
international ou a la date de priorit* et n'appartenant pas 
a ratal de la technique pertinent, mais cite pour comprendre 
ie principe ou (a theorie constituent la base de I'invention 
«X» document particuli*rement pertinent: rinvantion revendi- 
qu*e ne peut *tre consid*ree comme nouvelle ou comma 
impliquant une aetivit* inventive 
« Y » document particuli*rement pertinent; ^invention revan- 
diqu*e ne peut etre consid*r*e comme impliquant une 
aetivit* inventive iorsque le document est associe a un ou 
plusieurs autres documents de m*me nature, cette comoi* 
natson *ta'nt evident* pour une personne du metier. 
« A » document qui fait partie de la meme famine de brevets 



Oate a laquella la recherche Internationale a et* eflectivement 
achev*e 

10 juin 1986 


a -7 JUL 1988 


Administration charg*e de ia recherche Internationale 

OFFICE EUROPEEN DES BREVETS 




etionnara auionsa - 



Formulaire PCT/ISA/21Q (deuxi*me feuilla) (Janvier 1965) 



Damanda intarnationala H* PCT/FR 88/00025 -2- 



(SUITE DCS RENSEIGNEMENTS INDIQUiS SU* LA 
III. DOCUMENTS CONSIGNS COM ME PERTINENTS DEUXltME FEU ILL E) 




Categorta * 


fcj^ntfflcation dti documanta ctt*«. av#c indication, si nacaasaJra. 
daa paasagaa partfnanta 


W» da* rawndicattons 
vfaaaa 






pages 238-243 

voir le document en entier 




i. 


y 


Science / vol, 233 , 18 juillet 1986, 
l American Association for the Advancement 
of Science, (Washington, DC, US) 
F. Clavel et al. : "Isolation of a new 
human retrovirus from West African 
patients with AIDS 11 , pages 343-346 
voir le document en entier 


1-36 




Y . 


Nature, vol. 324, 18/25 decembre 1986, 
MacMillan Eds. (Londres, GB) 
F. Clavel et al. : "Molecular cloning 
and- polymorphism of the human immune 
deficiency virus type 2", pages 691-695 
voir le document en entier 


1-36 




Y 


Nature, vol. 321, 22 mai 1986, 
MacMillan Eds . ( Londres , GB ) 
M. Murphey-Corb et al. : "Isolation of 
an HTLV-IIT -related retrovirus from 
macaques with simian AIDS and its 
possible origin in asymptomatic 
mangabeys", pages 43 5-437 
voir le document en entier 


1-36 


■ 


P,X 


WO, A, 87/02038 (ONCOGEN) 9 avril 1987, 
voir apges 114-117; revendicaions 
31-55 


1,2,6-12, 
14-21,24 




P,X 


Journal of Cellular Biochemistry, Supplement 
11D, Ucla Symposia on Molecular & 
Cellular Biology, 29 mars - 1 mai 1987, 
Symposium on human retroviruses, 
16th Annual Meeting UCLA, 
voir page 44, abrege P112: 
"Human retroviruses, cancer and AIDS: 
approaches to prevention and therapy" 


1-36 




P,Y 


FR, A, 2593189 (PASTEUR) 24 juillet 1987, 
voir page 8, lignes 17-26; pages 13-15, 
revendications 1-18 


1-36 


P,Y 

i 


Nature, vol. 326, no. 6113, 9-15 avril 1987, 
MacMillan Eds . ( Londres , GB ) 
H. Kornfeld et al.: "Cloning of HTLV-4 
and its relation to simian and human 
immunodeficiency viruses" 
pages 610-613, 
voir le document en entier 
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loantfficatlon daa documanta cttaa. avac Indication, si nacaaaaira, 
daa paaaaoaa parti nan ti 


N* da* ravandleatlona 
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Nature, vol- 326, 16 avril 1987 , 
MacMillan Eds. (Londres, GB) 
M. Guyader et al.: "Genome organization 
and transactivation of the humen immuno- 
deficiency virus type 2, pages 662-669, 
voir le document en entier 

FEBS Letters, vol. 218, no. 2, juin 1987, 
Eds. Elsevier Siencc Publishers B.V. 
(Biomedical Division), 1987 Federation 
of European Biochemical Societies 
M.J.E. Sternberg et al.: "Prediction of 
antigenic determinants and secondary 
structures of the major AIDS virus 
proteins", pages 231-237 
voir le document en entier 
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SUITE DCS RENSEIGWEMEHTS iNOIQUSS SUR LA DEUXltME FEUILLE 



V OBSERVATIONS LORSOUML A tTt ESTIM* QUE CERTAIN E5 REVENDfCATIOKS NE POUVAIENT PAS FAIRE 
L'QgJ ET D'UNE RECHERCHE i 

Salon I'lrticf* 17.2) a) certainea revendicationa n'ont pat fait I'obfat d'une recherche pour fa* motifa suivanta: 

1 n Lea revendications numaroa aa rapportent 4 un objat a 1'egard duquel ia presente administration n'a pas Tobllgatfon da pro- 

* 1 eedec* la racftatcfta, i savar: 



2. fl Le* revendfcattona numaroa ae rapportent* dee parties da la demand* Internationale qui ne rempliessnt pas las conditions 

* — prescrites dana una maaure telle qu'une recherche significative ne peut etre eflectuee, preciaementi 



3. □ Le* revaluation, num*ro. »ont d«* ™ndfcationa dependante* et n* kh* pes r*dio>« confonnement k la deuxieme et a It tro4*i*ma 

— phrases de la regie fi.4.a) du PCT. 



VI, OBSERVATIONS UORSOU'IU Y A ABSENCE O'UHIT* OE CONVENTION » 



^administration chargee de fa recherch* Internationale a trouve plueieurs inventions dana la presente demande Internationale, c'eat-a-dire: 

Revendications 1,2, 6-21 ,23-36 

Revendications 1,2,6-21,23-36 toutes partiellement 3-5 
Revendications 23,25-28,34-36 toutes partiellement 22,24,29 

1. ^feRj Comma toutes fas tax** additlonnellea demandees ont et* payees dans ies delafs. Ia present rapport da recherch* Internationale 
"^^eouvre toutas Ies revendicationa de la demande Internationale pouvant fair* I'objet d'une recherche. 

2. □ Comm. seuiement un* parte des taxes addltionnelle* demand*** * ate pay*, dan, las d*.aia. ^^^^^^ 
L - 1 couvr* seulement caries des r*vend»cation* d* la d*mano* pour lasqueiles Ies taxes ont eta payeea, c est-e-dlre lea revendicationa . 

3. fl Aucun* tax* additidnnelle demandee n'a ate payee dans Ies delais par It da posant. En consequence, le preeent rapport de recherche 

international* est limit* 4 Hnvention mentlonnee en premier dana fas revendications; elle est couverte par ies revendications 
numaroa: 

4. fl Etant donna out toutaa fas revendicationa suscsptiblts da faire I'objet d'un* recherche le pouvaient sans effort ffSSSSJSS!SS 

un* tax* additionneile, radminiatration chargee da la recherche Internationale n'a sollicft* le peiement d'aucune taxe additionn.Ha. 

Remarque quant 4 fa reaerve 

□ Las taxes addltionnelle* de recherch* 4taient accompagne** d'un* reserve du deposant. 
jjjtf] Aucun* reserve n'a ete f site lore du paiament daa taxaa additlonnellea d* recherch*. 
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ANNEXE AU RAPPORT DE RECHERCHE INTERNATIONALE 

RELATIF A LA DEMANDE INTERNATIONALE NO. FR 8800025 

SA 20445 

La pr«ente annexe indique les membres de la famille de brevets relatifc aux documents brevets cites dans le rapport de 

recherche international vise ci-dcssus. ^/nn/sa 

Lesdits members sont contenus au fichier informatique de I'Office europeen des brevets a la i date du 23/06/88 

Lei renseig^ements fournis sont donnes a titre indicatif et n'engagent pas la respoosabd.te de I'Office europeen des brevets. 



Document brevet cite 
au rapport de recherche 


Date de 
publication 


Membre(s) de la 
famille de brevet(s) 


Date de 
publication 


WO-A- 8602383 


24-04-86 


FR-A- 


2571968 


25-04-86 




All — A — 

AU A 


JUO X / OJ 


02-05-86 






EP-A- 


0201540 


20-11-86 






JP-T- 


62500592 


12-03-87 






W0-A- 


8604336 


31-07-86 






AU-A- 


5320086 


13-08-86 






CD — A — 
tr A 




25-02-87 






in T 

JP-T- 


oZbU^Uyb 


20-08-87 


US-A- 4629783 


16-12-86 


EP-A- 


UcUl/ lb 


20-11-00 




WO-A- 


ocnc A 1 A 


06-11-86 






Alt A 

AU-A- 


CC7070C 

bb/c/ob 


16-10-86 






All A 

AU-A- 


b/ /ooob 


18-11-86 






EP-A- 


0220273 


06-05-87 






JP-T- 


62502617 


08-10-87 






A 1 1 — D — 

AU D 


J7 1 XC.O 


31-03-88 


EP-A- 0199301 


29-10-86 


AU-A- 


5636386 


23-10-86 




JP-A- 


• 62012799 




pD-A- m&7fidl 

tr M UiO/ u*ti 


09-07-86 


JP-A- 


61233700 


17-10-86 


WO-A- 8702038 


09-04-87 


AU-A- 


6299286 


09-04-87 




BE-A- 


905492 


25-03-87 






GB-A- 


2181435 


23-04-87 






FR-A- 


2587720 


27-03-87 






SE-A- 


8604007 


26-03-87. 






NL-A- 


8602422 


16-04-87 






FR-A- 


2593519 


31-07-87 






JP-A- 


63068075 


26-03-88 


FR-A- 2593189 


24-07-87 


WO-A- 


'8704459 


30-07-87 




AU-A- 


6891187 


14-08-87 






EP-A- 


0239425 


30-09-87 





Pour tout renseignement concernant cette annexe : voir Journal Officiel de I'Office europeen des brevets, No.12/82 



